• 最近访问:
发表于 2024-07-26 16:51:51 股吧网页版
专家访谈|王本友:分不清9.11和9.9谁大?大模型该做擅长的 而不是事事完美
来源:红星资本局

  作为生成式人工智能的代表,大模型已经进入全新的发展阶段。

  红星新闻、红星资本局与OpenEval平台联合发起“巢燧杯”大模型创新发展大赛,已于本月正式启动。2024“巢燧杯”大模型创新发展大赛由通用大模型评测、行业大模型评测大赛、专项挑战赛、大模型应用场景挑战赛四个大赛组成。

  近日香港中文大学(深圳)数据科学学院助理教授、深圳市大数据研究院研究科学家王本友在接受红星资本局专访时谈到,有了垂类模型不代表就能找到垂直应用,“最后一公里”涉及的问题非常复杂。他认为,垂类模型更像“先驱者”,有望比通用大模型更早实现“收大于支”。

  对于近期很多大模型在“9.11和9.9谁大”的问题上答错,王本友认为,我们应该对大模型有“不一样”的期待:让它做自己擅长的,而不是事事都完美。

有垂类模型

不代表就能找到垂直应用

  红星资本局:垂类大模型与通用大模型相比,能力有何不同?

  王本友:垂类模型的能力会更有侧重。比如我们自己做的华佗GPT-2,去年11月做了一个评测,当月的国家药剂师考试,不论是中医还是西医领域,华佗GPT-2领先国内所有国内中文大模型也包括GPT-4。

  但也有代价,华佗GPT-2在规划能力、推理能力、数学能力是比较高水平的,但是通用能力上相对缺陷,让它写代码肯定不如GPT-4,所以提升垂直领域的同时一定是牺牲一些通用能力的。

  红星资本局:垂类模型是否意味着解决了场景落地难这些问题?

  王本友:垂类模型诞生一定是为了解决垂直应用的问题,但有了垂类模型,不代表就能找到垂直应用。这个“最后一公里”涉及的问题要复杂得多。

  我们做华佗GPT-2也尝试了很多场景,现在看可能会有两个场景落地会比较成功。

  第一个是在分诊,患者不知道去哪个科室时可以跟华佗GPT-2聊一聊,它的能力是接近分诊台护士的,通过几轮对话就能判断适合的科室。这个场景的好处是比较简单,容错率高,即便出错可能就是会耽误一点时间,但不至于出性命之忧。今年深圳市龙岗区的12家医院会上线这个场景,我们认为会缓解当地医疗资源紧张的问题。

  第二个场景我认为是用医疗大模型去做特定的医疗影像的诊断,比如说看x光写报告,判断有没有什么疾病,或者做体检报告的生成。这些场景不涉及直接给用户答案,会给医生提供辅助,医生最后“把关”结果,再提供给患者。

  基于这个场景,大模型还可以先去做“医生助手”,帮医生提高就诊效率和学习效率,甚至可以做一些医生、医学生的医疗培训。当然这些场景也不意味一定能成功,还需要深入这个行业去了解和打磨尝试。

垂类大模型有望提早实现“收益大于支出”

  红星资本局:你认为垂类大模型发展形势如何?

  王本友:大模型技术快成熟的时候,它就会散播到各行各业。目前看大家都往“垂类应用”走,把大模型放在不同垂类应用去用。但对模型而言,我们并不是“一定要做一个垂直领域的模型”。

  我认为垂类模型跟通用模型可能是“合久必分,分久必合”的关系。最近一年多可以看到大模型底座发展很快,市面上也有不少接近GPT-4的模型,基于这些模型也能调出很好的效果,这就导致通用大模型得到更多关注;但是技术总会饱和,之后大家就会把通用大模型放在不同的垂类应用去试。同时垂类大模型里取得的经验,也可以反馈到通用大模型里去提升它的能力。两者我认为是相辅相成的。

  我们还是希望一个模型能解决所有问题,如果只有一个模型,更多的人就可以去分摊部署的成本。但这并不意味着垂类大模型就没有价值。垂类模型可以更快去探索垂类应用存在什么问题,先看水有多深,我相信最后这些经验还是会合到一起,放到通用大模型里。

  红星资本局:垂类大模型的挑战在哪里?

  王本友:什么场景最适合垂类模型来解决,这是一个非常难的问题。现在的情况是“懂大模型的人不懂领域、懂领域的人不懂大模型”,这是一个老生常谈的挑战。因为大模型技术派和各领域专家互相有着非常大的知识门槛,两者很难去对齐。

  我们真的需要非常好的既懂模型又懂场景的人找到一个点去突破,目前看来这些点大家找的都不太好。所以未来需要多培养一些大模型跟各个领域的复合型人才。

  另外一个挑战在于“直接把模型拿过来,但不见得就能用”。大部分人拿大模型往垂直一用,发现效果不好,就没耐心继续尝试,这也导致大模型在找应用场景方面,受到很多挫折,耐心越来越少,也导致整个行业都没有做好这件事情。

  垂类模型的试错成本也很高。以医疗来说,涉及到的东西非常复杂,很多时候选错一个赛道,可能就会错过5-10年的时间。这对企业就是灾难性的。

  比如说在传统医疗AI场景,大家都希望去给病人提供在线咨询,这件事的好处也是显而易见的。但实际上这个需求做了几十年,到现在几乎没有人在这个落地场景上做出一些成绩,做这类的公司现在都比较被动。原因就是大家小看了这个场景的复杂度,觉得AI能解决这个问题,但其实技术离真正做到这件事情还很远,而且这个场景容错性也非常低,一旦出错,伦理道德法律问题基本是不可能解决。

  红星资本局:那为什么还要做垂类大模型?

  王本友:垂类模型有它的优势。打个比方,通过大模型去解决医疗问题,需要1000亿,但是垂类模型,可以“阉割”很多不必要的能力,可能花费百亿左右就可以解决问题。相当于做的事情少,可以用更少的开销完成,这对做垂类模型的企业来说,也算成本优势。

  我们做大模型应用,本质上解决两个问题:成本和收益。如果收益小于成本,那用户越多亏得越多。

  垂类模型在于,成本可能会比通用大模型省10倍甚至更多。而且相较于通用大模型,它的收益也会更多,因为在通用大模型里写代码、聊天,本质上它带不了更多价值。

  但垂类模型,比如金融场景帮你买一个好的股票,会让用户赚一大波钱;在法律场景里也许还能省去律师的咨询费。就是说成本更低的垂类大模型,垂直应用带来的收益更多,那么它就可以比通用大模型更早实现收支平衡。

  这就是为什么垂类模型可以作为一个先驱者去探索的逻辑所在,它可以提早实现“收益大于支出”的点。

大模型不必“事事完美”

  红星资本局:您认为现在大模型发展面临的问题,更紧迫的是技术突破,还是成本问题?

  王本友:这两者是相辅相成的。只有你成本降低之后,技术才能发展更加迅猛。如果现在大家都可以很方便地去训练大模型,不用花太多成本,那大家肯定愿意各种尝试。只要尝试一个新的技术,大模型肯定就像雨后春笋一样铺开了。

  如果成本部署得很便宜,那所有人都可以去部署自己的模型,让大家用起来,用起来就产生价值,随后就有资本投入,资本投入就有更多的芯片,然后技术去实现突破,所以我觉得成本降低对技术有很大促进作用,同时技术发展本身也会促进成本降低。可以看到现在就有很多技术去研究怎么降低大模型推断成本。

  红星资本局:金融、医疗、法律行业对大模型的应用有哪些特别的挑战?您如何看待大模型在这几个行业数据隐私和安全性方面的应用?

  王本友:对金融的挑战,主要是大模型对数值的敏感性可能比较难,给它一串数字,或者给股票每天涨幅跌幅这种数值,模型可能不一定能理解“是涨是跌”。就好像最近“9.11和9.9谁大”大模型做错了,对金融模型来说这就是比较大的问题。

  对医疗模型来说,也涉及到数值问题,但更严重的还是知识储备不足,比如一个药的成分是什么,它如果不知道这个药就无法回答。法律的难点可能就在于引用条文的检索上,比如说在一个法律诉讼或者法律咨询上,我们要具体参考哪一条法律,哪个条文,如果没检索对那差错就很大。

  这几个行业涉及到隐私和数据安全的问题比较复杂。比如用户在使用大模型的时候,提问过程有没有将隐私泄露给大模型的可能。

  另外在给公众提供服务的时候,要尽量避免私有数据的使用。我们自己在训练医疗大模型时,严格意义上不会用医院的数据或者个人的私有数据,尽量用公开数据。现在面临的问题是公开数据比较饱和,如何在保证用户隐私和商业机密的前提下,去调用更多可用数据。

  我认为一方面用户自己要加强隐私方面的意识,另外也可以采用“端测大模型”方案,比如大模型直接部署在云端手机上,这样数据不用上云,不会泄露自己隐私,当然这个技术上也有挑战,还要看端侧模型能否满足需求。

  红星资本局:最近很多大模型在“9.11和9.9谁大”上答错,这是否意味着我们对大模型期待过高?

  王本友:大模型跟我们理解的数字不是一个东西,对大模型而言,数字也是token(Token通常指的是语言处理过程中的一个基本单位),它的处理方式要看怎么去拆分词。本质问题在于我们把一个连续空间里边的数值映射成向量空间里面的点,这对大模型而言是比较难的。

  但我认为这个问题并不需要去“解决”,大模型应该去处理它“擅长”的东西,不擅长的则通过工具来实现,比如调用计算器,这件事就很容易解决。

  人也是需要工具去解决问题,所以对大模型要有“不一样”的期待:让它做自己擅长的,而不是事事都完美。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500