職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
崗位職責:
1、負責開發適應網絡安全行業產品需求的大語言模型,提升產品的智能化水平和用戶體驗;
2、針對特定場景(如運營商、金融、醫療、教育、電力能源、交通等),進行大模型的微調與優化,確保模型在特定領域的性能表現;
3、基于大語言模型,設計和開發智能化工具,賦能企業內部工作流程,如自動化文檔生成、智能助手、智能客服、數據分析與決策支持等;
4、推動大模型在企業內部的應用,優化跨部門協作、知識共享和項目管理流程。
崗位要求:
1、碩士及以上學歷,計算機科學、人工智能、機器學習、自然語言處理(NLP)等相關領域/專業;
2、有3年以上大語言模型或NLP相關項目經驗,具備從0到1開發大模型產品的能力;
3、具有相關數學與理論基礎。掌握線性代數、概率論、微積分和信息論等數學基礎;掌握機器學習基礎,對Transformer架構和預訓練任務有深入理解;
4、具有相關工程實現能力。熟練掌握Python,熟悉PyTorch/TensorFlow/JAX框架,能夠高效實現模型結構和訓練邏輯;具有分布式訓練和性能調優經驗;
5、具有數據處理與工程化經驗,具有數據管道構建和存儲與加載優化經驗;
6、具有模型訓練與調試經驗,例如超參數優化和故障排查;
7、具有監督微調(SFT)經驗,熟悉任務適配與數據設計、訓練策略優化以及評估與迭代等;
8、具有模型蒸餾(KD)經驗,熟悉知識遷移方法、模型壓縮技術和資源敏感優化等;
9、具有持續學習和跨團隊協作的能力。
工作地點
地址:杭州濱江區杭州-濱江區迪普科技18樓


職位發布者
HR
杭州迪普科技股份有限公司

-
行業未知
-
公司規模未知
-
公司性質未知
-
浙江省杭州市濱江區通和路68號中財大廈6樓