• 最近访问:
发表于 2024-08-27 10:16:51 股吧网页版
人工智能训练师帮助学习模型识别“有用”信息—— 教人工智能读懂专业文件(新职业新故事)
来源:人民网

  打开电脑,开启智能训练软件,人工智能训练师杨洪旭开始一天的工作。他最近的任务是训练一个能自主识别银行电汇申请书的人工智能(AI)模型。

  杨洪旭供职的达观数据有限公司,位于上海浦东软件园,是一家智能文本处理技术企业。这里研发的AI模型,能读懂合同工单、财务报表、行业报告等各类文本文件,在银行流水识别、合同审核与比对等多场景落地应用。

  “在训练AI模型前,训练师首先要阅读大量相关的文件文本,从中提炼和标注出关键信息。”杨洪旭把读文本、做标注的过程比作老师备课,是训练的基础,“我们划重点、做标注,然后将‘有用’信息‘投喂’给AI模型,告诉它们应该提取哪些信息、按照什么格式提取。”人工智能训练师一年需要阅读上万份文档,训练几十个AI模型。

  杨洪旭在智能训练软件中打开某银行一张电汇申请书的扫描图像,将“业务种类”“汇款人名称”“账号”“开户银行”“联系地址”等字段信息一一拉框选中,再在旁边打上相应标签,随后点击生成训练模型。

  模型生成后,他需要给AI模型出一些练习题,输入字段信息,比对AI模型生成的结果,以此检验学习效果。当发现生成结果与原文本有出入时,杨洪旭会记录并整理成问题列表。“比如文章中有一处图像,它没有读取出来。有一个图像应该是正向的,它读取成了侧向的。”这些问题会统一反馈给AI模型的研发人员,为后续改进作参考。

  “AI模型经过训练后,再遇到类似的文本文件,它就能自主抓取、审读这些关键信息,更高效地执行人类指令。”在别人眼中单调、重复、略显枯燥的文档阅读、数据标注、效果测试等工作,杨洪旭却得心应手。他最开心的事就是看到自己训练的模型越来越“聪明”。

  1993年出生的杨洪旭,患有先天听力障碍,要戴助听器才能听到外界的声音。2014年,他从上海一所职业技术学院的环境设计专业毕业,先后做过家装设计、会计文员和仓库管理员等工作。

  “和客户交流时,因为口齿表达不够清晰流利,经常会有挫败感。”在杨洪旭陷入迷茫之际,上海市浦东新区残联向他推荐了达观数据有限公司的“人工智能训练师”岗位。尽管没有计算机编程技术基础,也对人工智能了解不多,但在听说这份新工作主要和机器打交道后,杨洪旭决定尝试。

  招聘杨洪旭入职的运营管理总监袁少杨说,公司首批人工智能训练师主要从事最基础的数据标注工作,重复的工作内容和大批量的标注强度,很考验人的耐心、细心和专注度。

  5年下来,踏实、专注、好学的杨洪旭赢得了同事们的交口称赞。在公司的内部培训和自我学习下,他逐渐胜任模型处理、产品测试、接洽客户等多项工作。2022年底,上海发布了首批人工智能训练师(二级)职业技能等级认定通过名单,杨洪旭位列其中。

  面对人工智能产业的飞速发展,杨洪旭主动学习AI模型主流的编程语言,编写一些简单代码处理模型出现的问题。“比如,当发现训练的模型有误读问题,我能够编写几行程序代码,做一些初步纠正,而不是把问题直接转给模型研发人员。”杨洪旭说,为了提升自己,眼下,他正在备考信息系统项目管理师职称证书。

  人工智能是上海的三大先导产业之一。近年来,上海从算力、语料、模型、测试、应用场景等方面布局人工智能产业,同时加大人才培养力度。2022年,上海启动人工智能训练师职业技能等级认定工作,目前已有450多人获得了“人工智能训练师”证书。

  《人民日报》(2024年08月27日 13 版)

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500