nlp自然語言處理工程師
1-1.5萬元/月崗位職責:
1、模型研發(fā):根據(jù)業(yè)務(wù)需求,設(shè)計、開發(fā)和優(yōu)化深度學習模型,提高模型的性能和準確性。
2、數(shù)據(jù)處理:負責數(shù)據(jù)的收集、清洗、標注和特征工程,為模型訓練提供高質(zhì)量的數(shù)據(jù)。
3、模型訓練與調(diào)優(yōu):使用深度學習框架進行模型的訓練,對模型進行調(diào)優(yōu)以提高性能,并解決訓練過程中出現(xiàn)的問題。
4、代碼編寫與維護:編寫高質(zhì)量的代碼,實現(xiàn)模型的開發(fā)和部署,并對代碼進行維護和優(yōu)化。
5、技術(shù)文檔編寫:編寫相關(guān)的技術(shù)文檔,包括模型的設(shè)計文檔、開發(fā)文檔、測試文檔等。
6、項目協(xié)作與溝通:與項目經(jīng)理、產(chǎn)品經(jīng)理和其他工程師保持密切溝通,確保項目的順利進行。
7、負責通用認知大模型和多模態(tài)大模型(包括十億、百億等參數(shù)量)的設(shè)計、開發(fā)和優(yōu)化,包括但不限于預訓練、SFT、指令微調(diào)、RLHF、Prompt工程、模型評估、模型推理等。
8、緊跟業(yè)界多模態(tài)大模型等方向的進展,探索前沿技術(shù),探索前沿技術(shù),形成系統(tǒng)算法/大模型解決方案,指導算法團隊研發(fā)落地工作,參與核心認知/多模態(tài)大模型的產(chǎn)品開發(fā)(包含但不限于智能客服、智慧營銷等),推動認知/多模態(tài)大模型效果達到行業(yè)前沿,包括智能問答、圖文內(nèi)容生成等。
9、積極探索大語言模型技術(shù)在落地場景中的應(yīng)用,包括但不限于大模型RAG、大模型BI、Multi-Agent智能體應(yīng)用等內(nèi)容。
技術(shù)棧要求:
1.編程語言
Python:首選開發(fā)語言,需精通NumPy、Pandas等數(shù)據(jù)處理庫及PyTorch/TensorFlow框架
C++/Java:用于高性能計算、系統(tǒng)底層優(yōu)化及工業(yè)級部署場景
java開發(fā):Springboot+Springcloud+MQ+數(shù)據(jù)庫?
2.核心算法
機器學習算法:掌握監(jiān)督學習(線性回歸、SVM)、無監(jiān)督學習(聚類)、強化學習等
深度學習模型:CNN(圖像處理)、RNN/LSTM(時序數(shù)據(jù))、Transformer(NLP)、擴散模型(生成式AI)
3.開發(fā)框架
深度學習框架:PyTorch(研究首選)、TensorFlow(生產(chǎn)部署)、Keras(快速原型)
數(shù)據(jù)處理工具:ApacheSpark(大數(shù)據(jù)處理)、HuggingFace(NLP模型庫)
進階技術(shù)能力:
1.數(shù)據(jù)處理與特征工程
數(shù)據(jù)清洗、特征提取、數(shù)據(jù)增強技術(shù),提升模型泛化能力
掌握SQL/NoSQL數(shù)據(jù)庫及分布式存儲方案?
2.模型優(yōu)化與部署
模型壓縮(量化、剪枝)、GPU加速、多線程優(yōu)化技術(shù)
云平臺部署(AWSSageMaker/AzureML)及容器化技術(shù)(Docker/Kubernetes)
3.領(lǐng)域適配開發(fā)
NLP方向:BERT/GPT系列模型微調(diào)、對話系統(tǒng)設(shè)計
CV方向:YOLO系列目標檢測、StableDiffusion生成模型
必備開發(fā)經(jīng)驗:
1.全流程項目經(jīng)驗
至少參與過2個以上完整AI項目(需求分析→數(shù)據(jù)準備→模型訓練→部署運維)
掌握Git版本控制、CI/CD自動化測試流程
2.跨領(lǐng)域協(xié)作能力
心理學/醫(yī)療/金融等垂直領(lǐng)域知識轉(zhuǎn)化能力(如情感咨詢機器人需心理學術(shù)語適配)
3.倫理與合規(guī)實踐
隱私數(shù)據(jù)脫敏處理、模型偏見檢測、AI倫理風險評估經(jīng)驗
任職資格:
1、本科及以上學歷,學信網(wǎng)可查,雙證齊全,5年以上工作經(jīng)驗,計算機科學、數(shù)學、統(tǒng)計學、人工智能等相關(guān)專業(yè)。
2、具有良好的溝通能力和團隊協(xié)作精神,能夠與其他工程師和產(chǎn)品經(jīng)理緊密合作,推動項目的進展。
3、熟悉主流的LLM大模型(Qwen,chatGLM,deepseek等)并有相關(guān)項目經(jīng)驗。
4、精通CNN,RNN,Transformer,Bert,ViT等深度學習理論算法和優(yōu)化;
5、對認知/多模態(tài)大模型訓練等有深入理解和實踐,有多機多卡大模型訓練、大模型微調(diào)、從0到1構(gòu)建多模態(tài)大模型(百億參數(shù)以上)等經(jīng)驗者優(yōu)先;
6、對主流大模型(例如GPT3/chatGPT/T5/PaLM/LLaMA/GLM等)的原理、性能、差異有深入理解;
7、熟悉常用的大模型分布式訓練框架,如deepspeed/megatron等
8、熟悉AI領(lǐng)域常見的開發(fā)語言、開發(fā)框架、通用平臺和技術(shù);深入了解大模型在產(chǎn)品化過程中的調(diào)優(yōu)、量化、封裝、部署、調(diào)度、并發(fā)、時延等常見軟硬件問題,
9、思維邏輯能力強,業(yè)務(wù)理解能力強,能夠充分理解業(yè)務(wù),能夠根據(jù)原型實現(xiàn)前后端業(yè)務(wù)邏輯交互.
工作時間:
9:00-18:00,午休2h,周末雙休;法定節(jié)假日正常休息,春節(jié)假期不低于2周~