機器學習研究人員需要編碼的程度如何?
讓我專門回答ML研究人員,而不是ML工程師或數據科學家。
我曾在學術界(包括博士后)和工業界擔任ML(+ CV)研究員。
絕對。我總是需要編碼一噸。
在工業中,我的工作的一半是評估哪些問題在文獻中解決了什么程度。這意味著要實施大量論文并在內部數據集上進行嘗試。
數字很??好。實驗評估是我在論文中看到的第一部分。但他們從不告訴你整個故事。
在大多數對我來說不熟悉的問題上,查看表格并不能讓我感覺這種方法的效果如何,如果它足以讓我們使用,或者至少如果它可以用幾個月的時間來獲得它表現到我們需要的地方。
這通常意味著我自己實施該方法。
有時可以使用給定方法的代碼,但是使用了錯誤的許可證,因此我無法將其作為營利性產品組的一部分。其他時候,開源代碼在框架或編程語言中效率不高,因此它與我可能已經擁有的其他組件[0]不能很好地融合。很少,我能夠按原樣使用別人的代碼,至少可以用于我自己的原型設計和評估。
在我的博士期間,我當時正在研究一個相當新穎的主題,因此幾乎沒有可用的開源代碼。因此,40%的時間用于編寫代碼,50%用于實際訓練或運行實驗,另外10%用于寫作或閱讀[1]。
有了這個背景,我可以實現任何東西,并使用任何大小的代碼庫。
但是,誠然,我的代碼并不像我使用的專業軟件工程師那樣漂亮。我似乎也無法吸收他們對長期可擴展性和可維護性的擔憂。不幸的是,我的研究培訓已經從這些考慮中接種了我。我也沒有興趣討論編程語言或環境的利弊,或者像我一樣經常參與的熱心開發人員之類的標簽 - 空間等徹頭徹尾的愚蠢的事情。
因此,如果您對我的研究技能或CV / ML知識不感興趣,那么您真的不想雇用我作為通用軟件工程師。
[0]我從事嵌入式計算項目,通常計算效率很重要。
[1]不可否認,在我的博士學位課程開始后的第一個月或第二個月我沒有讀過多少內容,我現在試圖彌補這一點。雖然我在業余時間參加過很多課程。



















