复现顶会代码不知道如何配置参数训练?

在复现2022年ICML·data领域的顶会代码时不理解readme上的参数配置怎么跑?

Then estimate the V-usable information using v_info.py. This will write a CSV file of the pointwise V-information (PVI) values -- for every example in the SNLI test data -- which you can average to estimate the V-usable information.

from v_info import v_info

v_info(
  f"./data/snli_test_std.csv",
  f"{MODEL_DIR}/finetuned/bert-base-cased_snli_std2",
  f"./data/snli_test_null.csv", 
  f"{MODEL_DIR/finetuned/bert-base-cased_snli_null",
  'bert-base-cased',
  out_fn=f"PVI/bert-base-cased_std2_test.csv"
)

这个参数配置用什么平台与方式跑。

该回答引用ChatGPT

这段代码中的v_info函数是一个Python函数,用于计算SNLI测试数据集中每个例子的点信息量(PVI),以估计V可用信息。根据函数的参数配置,这个Python函数需要在Python环境下运行。

可以使用类似于Anaconda、Jupyter Notebook或其他Python IDE的平台,安装相关的Python库(如PyTorch、numpy等)并在该平台中运行代码。如果你已经在本地安装了Python和所需的Python库,则可以使用终端或命令行界面,在代码所在的目录下运行以下命令:

python v_info.py ./data/snli_test_std.csv MODEL_DIR/finetuned/bert-base-cased_snli_std2 ./data/snli_test_null.csv MODEL_DIR/finetuned/bert-base-cased_snli_null bert-base-cased --out_fn PVI/bert-base-cased_std2_test.csv

其中,./data/snli_test_std.csv和./data/snli_test_null.csv分别是标准和空值测试数据集的文件路径,MODEL_DIR/finetuned/bert-base-cased_snli_std2和MODEL_DIR/finetuned/bert-base-cased_snli_null分别是标准和空值训练好的BERT模型的文件路径,bert-base-cased是BERT模型的名称,--out_fn参数指定输出结果的CSV文件名为PVI/bert-base-cased_std2_test.csv。

请注意,这里的MODEL_DIR需要替换为实际的文件路径,以便找到训练好的BERT模型。另外,如果你在使用Jupyter Notebook或其他Python IDE,则可以在代码中直接调用v_info函数,而无需在终端或命令行界面中运行代码。

您好,根据您提供的信息来看,那段英文中提到了v.info.py文件,结合代码中的格式来看,确定是python需要的程序文件。因此您可以在自己电脑上安装一个python环境来运行。安装完后,直接右键用python自带的idle打开

img

修改一下里面涉及到的数据文件的位置,改为数据文件在自己电脑上的实际位置,点击上面菜单中的run run module就可以运行了。

img

参考GPT和自己的思路,根据您提供的代码,似乎是 Python 脚本,并且是在命令行中运行。为了运行这个脚本,您需要在命令行中输入相应的参数。

根据这段代码的注释,它需要以下参数:

输入 SNLI 测试数据的路径 f"./data/snli_test_std.csv"
输入 SNLI 测试数据的 BERT 模型路径 f"{MODEL_DIR}/finetuned/bert-base-cased_snli_std2"
输入一个包含空数据的 SNLI 测试数据的路径 f"./data/snli_test_null.csv"
输入一个与上述 SNLI 测试数据相应 BERT 模型的路径 f"{MODEL_DIR/finetuned/bert-base-cased_snli_null"
输入 BERT 模型的名称 'bert-base-cased'
指定输出 CSV 文件的路径 out_fn=f"PVI/bert-base-cased_std2_test.csv"
因此,您需要在命令行中执行这段代码,并将上述参数替换成实际的路径和名称。您需要先进入到包含这个脚本的目录,然后使用以下命令运行脚本:

python v_info.py [输入 SNLI 测试数据的路径] [输入 SNLI 测试数据的 BERT 模型路径] [包含空数据的 SNLI 测试数据的路径] [与 SNLI 测试数据相应的 BERT 模型的路径] [BERT 模型的名称] --out_fn=[输出 CSV 文件的路径]

以下是示例代码,其中将 [...] 替换为实际的路径和名称:

from v_info import v_info

v_info(
  f"[输入 SNLI 测试数据的路径]",
  f"[输入 SNLI 测试数据的 BERT 模型路径]",
  f"[包含空数据的 SNLI 测试数据的路径]",
  f"[与 SNLI 测试数据相应的 BERT 模型的路径]",
  'bert-base-cased',
  out_fn=f"[输出 CSV 文件的路径]"
)

在命令行中运行时,可以使用以下命令(将 [...] 替换为实际的路径和名称):

python v_info.py [输入 SNLI 测试数据的路径] [输入 SNLI 测试数据的 BERT 模型路径] [包含空数据的 SNLI 测试数据的路径] [与 SNLI 测试数据相应的 BERT 模型的路径] bert-base-cased --out_fn=[输出 CSV 文件的路径]

如果对您有帮助,请给与采纳,谢谢。

以下答案基于ChatGPT与GISer Liu编写:
这段代码是使用 Python 调用 v_info.py 文件中的 v_info 函数,用于计算某个经过训练的 BERT 模型在 SNLI 测试集上每个样本的 pointwise V-information (PVI) 值,并将结果保存为 CSV 文件。其中函数的参数含义如下:

  • 第一个参数:SNLI 测试集数据的 CSV 文件路径
  • 第二个参数:经过 finetune 的 BERT 模型的路径
  • 第三个参数:SNLI 测试集数据的 CSV 文件路径,其中 premise 和 hypothesis 都为空字符串
  • 第四个参数:经过 finetune 的 BERT 模型的路径,其中 premise 和 hypothesis 都为空字符串
  • 第五个参数:使用的 BERT 模型的名称,例如 'bert-base-cased'
  • 第六个参数:结果保存的文件路径
    这段代码并没有涉及到具体的平台或方式。只要按照上述参数说明设置好参数,将其保存为 Python 文件,然后使用 Python 解释器运行即可。