会議が望んでいること:データサイエンスにおける実験の再現性

主要な科学会議では、実験の再現性が求められています。そして、これは、作品の信頼性を高め、価値(再利用性と引用)を抽出し、「トレンド」(ジャーナルNatureの調査による)を引き出すために必要です。





期待は高まっており、2021年にはすでに10回の会議のうち9回が著者に再現性のチェックを提供しています。試験に合格し、質問票に記入し、証人を連れてくるなど。 





私たちが話していること、なぜ再現性が必要なのか、どのような問題を解決する必要があるのか​​、この記事で説明します。 





機械学習の実験

. .





, . , train, test .





, , , . , , (pipeline) .





, .





, AAAI 2014, AAAI 2016, IJCAI 2013 IJCAI 2016 , 80% — !





,

2021 . GuideToResearch (Top 100), Machine Learning, Data Mining & Artificial Intelligence. .





#

















1





CVPR 2020





http://cvpr2020.thecvf.com/submission/main-conference/author-guidelines





Encouraged





2





NeurIPS 2021





https://neurips.cc/Conferences/2021/PaperInformation/PaperChecklist





Required





3





ICCV 2021





http://iccv2021.thecvf.com/node/4





Encouraged





4





ECCV 2020





https://eccv2020.eu/reviewer-instructions/





Encouraged





5





AAAI 2021





https://aaai.org/Conferences/AAAI-21/aaai21call/





Required





6





ICML 2021





https://icml.cc/Conferences/2021/CallForPapers





Encouraged





7





SIGKDD 2021





https://www.kdd.org/kdd2020/files/KDD_2020_Call_for_Research_Papers.pdf





Encouraged





8





IJCAI 2021





https://ijcai-21.org/cfp/





Required





9





ICLR 2021





https://iclr.cc/Conferences/2021/CallForPapers





Not found





10





ACL 2021





https://2021.aclweb.org/calls/papers/





Reminder





:





  • Not found — CFP .





  • Reminder — .





  • Encouraged — , .





  • Required — .





, . , , , . , , . ( NeurIPS, Gundersen et al.). 





, , .





, . , 2020-2021 , , . ACM , :





(repeatable experiment / )

, .





(artifact) , , , , , .





(reproducible / )

, .





(replicable / )

.





, « », .





.

, - https://en.wikipedia.org/wiki/Reproducibility





XX :





non-reproducible single occurrences are of no significance to science”





— Popper, K. R. 1959. The logic of scientific discovery. Hutchinson, London, United Kingdom.





. .





.





: , ? -, , (, ). , ?





: , , . , ? ? , , !





, ?





. , arxiv.org paperswithcode.org. ? ? ? ? . « », — .





— provenance

. ! Prov-ML . UML 2 ( , << «).





. ? ? ? ? ?





. , , , . , , .





— ?! 

. , , , .





— , , code style, , , .





— //, / ( ), . . , (. ).





, « » StackOverflow StackExchange. « , . — , . , , , , , , .»





, , -, .





,





Jupyter Notebooks, GitHub, , 4% .





4%, !





, , : 





A Large-scale Study about Quality and Reproducibility of Jupyter Notebooks.





— . requirements.txt, setup.py. - .





— . , .





— , , .





, , , :





  • (40%)





  • (13%)





  • ( matplotlib ) (52%)





  • (3%)





  • (3%)





  • . python (4%)





  • (27%)





? , R 44% ( , ). , .





?

. .





, « » (. « DL» , google it). 





. .





— . (a.k.a. MLOps), (Exploratory Data Analysis, EDA) , , - .





— . , , .





, , - ( , )!





ML — , (hardcore).





P.S. FAIR

, (Findable), (Accessible), (Interoperable) (Reusable) (FAIR) 2016 , .





[1] .





[2] .





[3] .





[5] Jupyter Notebooks. 





[6] .





[7]  , Best Practices for Scientific Computing





[8] Top Ten Reasons (not) to Share your Research Code .





[9]再現性に大きな影響を与える調査結果の記事、再現性のための実験と研究慣行の理解:探索的研究








All Articles