中文字幕丝袜在线56页_亚洲另类色区欧美日韩_国产精品国色综合久久_国产a一级毛片午夜剧场14,天天色综合天天,日本免费一区二区三区四区五六区,99精品免费视频

更新于 5月15日

大模型數據工程師

1.7-2.5萬
  • 北京東城區
  • 3-5年
  • 本科
  • 全職
  • 招1人

雇员点评标签

  • 工作環境好
  • 同事很nice
  • 團隊執行強
  • 人際關系好
  • 氛圍活躍
  • 交通便利
  • 實力大公司
  • 五險一金

职位描述

大模型數據工程師
核心職責:1. 數據構建與優化: 設計并開發大模型預訓練、微調(SFT)、強化學習(RLHF)等階段的高質量數據集,涵蓋文本、多模態等場景。 制定數據清洗、去噪、標注策略,設計數據增強方案,提升數據多樣性和有效性。 整合多來源數據(開源/業務日志/用戶反饋等),解決數據稀缺性和分布偏差問題。 2. 數據質量評估與治理: 建立數據質量評估體系,制定量化指標(如一致性、多樣性、偏差度),分析數據缺陷并提出改進方案。 開發自動化工具(如規則引擎、模型輔助標注),提升數據處理效率與標準化水平。 3. 評測框架設計與模型評估: 構建大模型能力評測體系,開發自動化評估工具,設計多維度指標(準確性、魯棒性、安全性等)。 針對模型輸出進行人工/自動化評估,分析模型優缺點,撰寫評估報告并提出調優建議。 跟蹤學術界與工業界評測方案(如HELM、Open LLM Leaderboard),推動前沿方法落地。 4. 協作與賦能: 與算法工程師、產品經理緊密合作,理解業務需求,設計數據閉環方案。 沉淀數據與評測方法論,推動團隊標準化流程建設。 任職要求: 1. 計算機科學、人工智能、統計學等相關領域碩士及以上學歷,本科要求211,3年以上大數據/算法相關經驗。 2. 精通Python,熟悉PyTorch/TensorFlow框架,熟練使用Pandas/Numpy等數據處理庫。 3. 深入理解大模型技術(如Transformer、Prompt Engineering、RLHF),具備數據側調優實戰經驗。 4. 熟悉主流數據工具鏈(Hugging Face Datasets、Spark、SQL),具備分布式數據處理能力。 經驗要求: 1. 至少主導過1個完整的大模型數據項目(如構建千億token級預訓練數據或萬級SFT數據)。 2. 具備評測框架開發經驗,熟悉BLEU/ROUGE等傳統指標及基于LLM的自動評估方法(如GPT-4評估)。 3. 對數據敏感,能通過統計分析、可視化工具(Tableau/Matplotlib)洞察數據問題。 加分項: 1. 在ACL/EMNLP等頂會發表數據相關論文,或貢獻過開源數據集/工具。 2. 熟悉多模態數據處理(圖像/音頻/視頻)或垂直領域數據(法律、醫療、代碼)。 3. 具備全棧開發能力,可快速搭建數據標注平臺或評測Demo。 特別說明:此為外包崗位,需在客戶現場辦公

工作地点

北京東城區中海地產廣場
以担保或任何理由索要财物,扣押证照,均涉嫌违法。一经发现,
我要招人

职位发布者

尹曉梅/人事經理

剛剛活躍
立即沟通
浪潮集團公司标签
浪潮集團是中國領先的云計算、大數據服務商,擁有三家上市公司。主要業務涉及計算裝備、軟件、云計算服務、新一代通信、大數據及若干應用場景。作為中國最早的IT品牌之一,浪潮致力于成為世界一流的新一代信息技術龍頭企業經濟社會數字化轉型的優秀服務商,新型基礎設施建設的骨干企業。
公司主页

上智联,你更值3.74亿+ 职场人的选择 780万+ 高新职位精准推荐

主站蜘蛛池模板: 武宣县| 色达县| 龙陵县| 马鞍山市| 灌云县| 鹤岗市| 桂东县| 满城县| 信阳市| 宜兰市| 伊吾县| 土默特右旗| 安平县| 农安县| 永和县| 绍兴市| 寿阳县| 镶黄旗| 商洛市| 榕江县| 临颍县| 宣威市| 巴彦淖尔市| 潞西市| 宜州市| 和平县| 镇平县| 罗城| 普格县| 栖霞市| 嘉黎县| 孝感市| 阜南县| 略阳县| 丽水市| 屯留县| 诸暨市| 营山县| 阜南县| 汤阴县| 甘泉县|