OCR與AI算法工程師
2-2.5萬元/月崗位職責:
1、設計與優(yōu)化多語言OCR算法,支持復雜場景下的文字檢測、識別及多語種混合排版處理能力。
2、提升版面分析能力,實現(xiàn)對文檔結(jié)構(gòu)(如表格、圖像、標題)的智能識別與還原,增強復雜布局的解析精度。
3、集成主流開源OCR框架,優(yōu)化圖像預處理、特征提取與結(jié)果后處理流程,適配高分辨率圖像及動態(tài)應用場景。
4、搭建基于大語言模型的AIAgent工作流,規(guī)劃任務拆解、工具調(diào)用(如RAG、函數(shù)調(diào)用)及多模態(tài)交互邏輯設計。
5、精進提示詞工程(PromptEngineering),提高模型在特定業(yè)務場景中的推理準確性與輸出一致性。
6、研究多Agent協(xié)作機制,推動復雜任務中多個智能體的協(xié)同運作與自動化流程落地。
7、關注前沿技術(shù)進展(如多模態(tài)Agent、AutoGPT),快速評估并引入優(yōu)質(zhì)開源項目(如LlamaIndex、LangGraph)。
任職要求:
研究生學歷,本科為985、211院校且能力突出者可酌情考慮
1、技術(shù)能力
圖像算法功底扎實:掌握CNN/Transformer等網(wǎng)絡架構(gòu),具有OCR、版面分析或文檔數(shù)字化相關項目經(jīng)驗。
大模型應用經(jīng)驗豐富:熟悉LLM微調(diào)方法,具備Agent框架開發(fā)實踐(如LangChain)。
編程能力良好:熟練運用Python/PyTorch/TensorFlow,具備系統(tǒng)化開發(fā)能力及Linux平臺開發(fā)背景。
2、特質(zhì)要求
技術(shù)洞察力強:關注新興技術(shù)方向(如多模態(tài)Agent、AutoML),能高效完成技術(shù)驗證與方案選型。
開放共享意識:參與過主流開源項目,有代碼貢獻或自研工具優(yōu)化案例者優(yōu)先。
問題攻關能力強:善于從實際業(yè)務需求出發(fā)反推技術(shù)實現(xiàn)路徑,獨立解決算法優(yōu)化與性能瓶頸問題。
3、加分項
了解多模態(tài)模型,擁有視覺-語言聯(lián)合建模實踐經(jīng)驗。
熟悉工業(yè)級Agent全流程開發(fā),涵蓋意圖識別、任務調(diào)度及異常恢復機制設計。