您當前的位置：首頁 > 職位列表 > 職位詳情

OCR與AI算法工程師

2-2.5萬元/月

投遞簡歷

四川-成都

3-5年 C/C++ · 深度學習 · 大模型算法 · 圖像處理庫（OpenCV等） · 可兼職 · 圖像生成 · 優(yōu)秀開源項目經(jīng)歷 · OCR · Python · 模型加速/性能優(yōu)化

2025-12-24 14:25:32 更新被瀏覽：204 次

四川譯訊信息科技有限公司

最近在線時間：2025-12-24 14:25:32

電話：189********

地址：中國(四川)自由貿(mào)易試驗區(qū)成都高新區(qū)天府五街200號2棟A區(qū)10樓1011-2室

職位描述

崗位職責:
1、設計與優(yōu)化多語言OCR算法，支持復雜場景下的文字檢測、識別及多語種混合排版處理能力。
2、提升版面分析能力，實現(xiàn)對文檔結(jié)構(gòu)（如表格、圖像、標題）的智能識別與還原，增強復雜布局的解析精度。
3、集成主流開源OCR框架，優(yōu)化圖像預處理、特征提取與結(jié)果后處理流程，適配高分辨率圖像及動態(tài)應用場景。
4、搭建基于大語言模型的AIAgent工作流，規(guī)劃任務拆解、工具調(diào)用（如RAG、函數(shù)調(diào)用）及多模態(tài)交互邏輯設計。
5、精進提示詞工程（PromptEngineering），提高模型在特定業(yè)務場景中的推理準確性與輸出一致性。
6、研究多Agent協(xié)作機制，推動復雜任務中多個智能體的協(xié)同運作與自動化流程落地。
7、關注前沿技術(shù)進展（如多模態(tài)Agent、AutoGPT），快速評估并引入優(yōu)質(zhì)開源項目（如LlamaIndex、LangGraph）。

任職要求：
研究生學歷，本科為985、211院校且能力突出者可酌情考慮

1、技術(shù)能力
圖像算法功底扎實：掌握CNN/Transformer等網(wǎng)絡架構(gòu)，具有OCR、版面分析或文檔數(shù)字化相關項目經(jīng)驗。
大模型應用經(jīng)驗豐富：熟悉LLM微調(diào)方法，具備Agent框架開發(fā)實踐（如LangChain）。
編程能力良好：熟練運用Python/PyTorch/TensorFlow，具備系統(tǒng)化開發(fā)能力及Linux平臺開發(fā)背景。

2、特質(zhì)要求
技術(shù)洞察力強：關注新興技術(shù)方向（如多模態(tài)Agent、AutoML），能高效完成技術(shù)驗證與方案選型。
開放共享意識：參與過主流開源項目，有代碼貢獻或自研工具優(yōu)化案例者優(yōu)先。
問題攻關能力強：善于從實際業(yè)務需求出發(fā)反推技術(shù)實現(xiàn)路徑，獨立解決算法優(yōu)化與性能瓶頸問題。

3、加分項
了解多模態(tài)模型，擁有視覺-語言聯(lián)合建模實踐經(jīng)驗。
熟悉工業(yè)級Agent全流程開發(fā)，涵蓋意圖識別、任務調(diào)度及異常恢復機制設計。