域自适应方法MIC代码复现流程及问题解决记录

黄金大风车 · 发表于 2024-9-11 12:04:40

题目：MIC:MaskedImageConsistencyforContext-EnhancedDomainAdaptation论文：arxiv.org/pdf/2212.01322源码：https://github.com/lhoyer/MIC1.配置训练环境1.1获取代码直接在github上下载，解压后打开文件夹可以看到有分类（cls）、检测（det）、分割（seg）三个任务类型，此时右键cls用pycharm打开1.2创建虚拟环境在AnacondaPrompt中创建名为MIC的虚拟环境，根据项目中readme文件中的要求，选择python为3.8.5版本condacreate--nameMICpython=3.8.5此时即可打开pycharm中刚刚创建的项目界面，点击右下角解释器添加本地解释器，打开conda环境列表，选择刚刚创建的虚拟环境MIC然后在终端下载依赖pipinstall-rrequirements.txt2.训练脚本2.1参数配置对于论文中的实验，可以使用脚本自动生成不同的配置并对其进行训练pythonrun_experiments.py--exp打开experiments.py参阅有关可用实验及其分配ID的更多信息这里选择第二套实验配置elifid==2:architecture='resnet101'datasets=[('VisDA2017','Synthetic','Real'),]udas=[#udamethod,alpha,q,patch,ratio,aug('cdan_mcc_sdat_masking',0.9,None,64,0.7,True),]for(dataset,source,target),(uda,alpha,pseudo_label_weight,mask_block_size,mask_ratio,caug)\initertools.product(datasets,udas):ifcaug:#augmentationparametersfromDAFormermask_color_jitter_p,mask_color_jitter_s,mask_blur=0.2,0.2,Trueelse:mask_color_jitter_p,mask_color_jitter_s,mask_blur=0,0,Falsecfg=config_from_vars()cfgs.append(cfg)只需在终端输入以下命令即可选择该配置开始训练pythonrun_experiments.py--exp2在运行训练命令之前需要登录wandb网站，注册登录之后创建一个项目，项目命名为cls（任意命名），然后回到pycharm界面打开终端输入wandblogin按照提示登陆wandb，如果报错则更新wandb。然后打开examples下的cdan_mcc_sdat_masking.py文件，将project的值更改为刚才创建的项目名称。2.2数据集预下载（可选）实验配置2中用到的数据集是visda2017，可以在examples文件下按照如下结构创建目录下载网址： ("image_list","image_list.zip","https://cloud.tsinghua.edu.cn/f/c107de37b8094c5398dc/?dl=1"),("train","train.tar","http://csr.bu.edu/ftp/visda17/clf/train.tar"),("validation","validation.tar","http://csr.bu.edu/ftp/visda17/clf/validation.tar")如果需要提前下载另一个数据集Officehome，下载方法类似不提前下载也行，运行训练脚本时会自动下载，只要网络没问题结果是一样的。但是其中的image_list文件经常因为网络问题无法下载，即使提前下载也有可能下载不了，因个人网络情况而异，如果这个文件实在无法下载，可以等train和validation都下载并解压好了，在两个文件夹的最后分别可以找到一个image_list.txt文件，只需将这两个文件复制到image_list下，并将来自train文件夹中的txt文件改成train.txt，来自validation文件夹中的txt文件改成validation.txt。3.训练中的报错及解决方法3.1路径问题报错：Thesystemcannotfindthepathspecified.解决：run.experiments.py中用到cd方法，且使用不正确，注意cd方法一般是在命令行使用的快捷命令，用于修改工作目录，可改用cwd方法，代码修改如下，整体替换即可importargparseimportsubprocessfromexperimentsimportgenerate_experiment_cfgsif__name__=='__main__':parser=argparse.ArgumentParser()parser.add_argument('--exp',default='2',type=int,help='Experimentidasdefinedinexperiment.py',)parser.add_argument('--machine',type=str,default='local',choices=['local',])args=parser.parse_args()cfgs=generate_experiment_cfgs(args.exp)fori,cfginenumerate(cfgs):ifargs.machine=='local':print(f'Runconfig{i}/{len(cfgs)}:',cfg)sub_out=subprocess.run(cfg["EXEC_CMD"],shell=True,cwd=cfg["subfolder"])ifsub_out.returncode!=0:print(f"Errorexecuting{cfg['EXEC_CMD']}in{cfg['subfolder']}")else:raiseNotImplementedError(f"Machinetype{args.machine}isnotsupported.")另外运行训练脚本前要保证工作目录一定要在cls下，比如(MIC)PSF:\ME\downloading\MIC-master\cls，否则还会报错找不到路径3.2内存问题报错：RuntimeError:[enforcefailat..\c10\core\CPUAllocator.cpp:79]data.DefaultCPUAllocator:notenoughmemory:youtriedtoallocate102760448bytes.解决：如果是用cpu调试代码，一定会遇到内存不足的问题，可以在训练脚本cdan_mcc_sdat_masking.py中的342行把默认的batch-size调成2，356行的workers改成0parser.add_argument('-b','--batch-size',default=16,type=int,parser.add_argument('-j','--workers',default=0,type=int,metavar='N',3.3numpy更新语法弃用问题dalib/modules/grl.py文件中第71行有个过时的用法np.float需要更改，只需去掉np.3.4torch和cuda版本不对应导致无法调用GPU在GPU上训练时还是会显示内存不足，打开命令行输入命令nvidia-smi可以看到GPU占用情况，发现GPU没有被调用，训练时仅使用了CPU，那这种情况就很可能是torch和cuda版本不对应引起的，所以我们去这个网站（download.pytorch.org/whl/torch_stable.html）上下载和我们需要的版本接近的torch+cuda的二进制包，这里的包都是对应好的，另外还要再下载一个对应的torchvision包（版本对应参考下表）这里我选择了torch1.10.0，那么torchvision版本就是0.11.0注意两个文件的完整文件名，其余部分要选一样的，都有cu113，cp38，windows系统下载好之后使用pip指定路径安装，如果下载好文件位于C:\Users\ME路径下，则安装命令为pipinstallC:\Users\ME\torch-1.10.0+cu113-cp38-cp38-win_amd64.whlpipinstallC:\Users\ME\torchvision-0.11.0+cu113-cp38-cp38-win_amd64.whl

		自动登录	找回密码
密码			会员注册