【崗位要求】
1、本科及以上學歷,計算機相關專業(yè)或數學專業(yè),1年以上開發(fā)經驗;
2、扎實的編程基礎,精通PYTHON,熟悉一種或多種深度學習框架(Pytorch/TensorFlow)作為加分項;
3、熟悉 Linux 常用命令,掌握在 Linux 下搭建環(huán)境及開發(fā)部署測試,熟悉docker鏡像操作和部署;
4、在大模型、算法、語音、圖像處理等一個或多個領域有扎實的理論基礎和豐富的實戰(zhàn)經驗優(yōu)先;
5、具有音頻數據處理相關技能如ffmpeg,torchaudio,librosa,pydub,wave等優(yōu)先;
【工作職責】
1、負責多模態(tài)大模型數據語料(語音、視頻、圖像、文本等)生產和處理,包括但不限于數據生成增強、分布研究、數據獲取、數據規(guī)范化、數據質量檢測、打標等,確保訓練數據的有效性,可用性;
2、負責優(yōu)化和改進現有的數據清洗和質檢打標流程,提高效率和準確性;
3、負責大模型相關數據工具鏈的開發(fā)實現及應用維護等;
項目介紹:專注于AI數據處理,為大模型訓練提供高質量的多模態(tài)數據(文本/圖像/音視頻等)支持。核心業(yè)務包括數據預處理、生成增強、清洗過濾、異常檢測、特征提取和質量校驗,確保數據精準合規(guī)。同時參與訓練與推理優(yōu)化,
4、語音合成:Paddle、TTS
語音克?。篤ITS、XTTS
語音識別:Whisper、Funasr
ASR 音頻數據采集、清洗、處理、去噪、人聲分離、文字轉寫、標注