首页 > 滚动

拓尔思林松涛:发挥高质量数据积淀优势 打通大模型落地关键路径 全球要闻

搜狐科技 2023-06-08 18:58:40

21世纪经济报道记者雷晨 北京报道

6月6日,由21世纪经济报道、北京人工智能产业联盟元宇宙专业委员会、中国文化产业协会文化元宇宙专业委员会主办的“21世纪卓越董事会人工智能闭门会”召开,主题为“AI领域上市公司创新涌现、技术难题与发展路径”。

会上,拓尔思(300229.SZ)副总裁林松涛介绍了“拓天”大模型及行业应用。他表示,大模型技术场景落地中的挑战,主要是质量、可控、时效和成本。


(资料图片仅供参考)

质量方面,他认为,个人服务用ChatGPT,提示词不准可以换一个,如果图片生成不好也可以再换一个,可以说个人对AIGC的容忍度是很高的。但是企业不一样,给政府写顾问报告,数据来源必须是准确的。

可控层面,一是内容安全,数据是有价值观的,模型没有价值观。二是私域数据安全,中国大模型要数据化落地,如何在保证用户私有数据安全的同时将大数据较好地运用也是一个问题。

时效方面,在大数据训练上,灾难性的遗忘一直都是训练的问题,所以需要大模型解决这个问题。另外,怎样输入即时数据,类似Chat GPT,数据最新只到2021年9月,因此在To B服务的时候用不好。

成本方面,千亿模型私有化落地的时候需要训练好,在企业端落地还需要让企业用得起。拓尔思做To B服务,垂直场景落地成为“百模大战”的核心要点。

据林松涛介绍,大模型出来以后颠覆了拓尔思此前积累的NLP技术,公司发现,在大模型的基础上再去结合知识图谱、自然语言处理技术效果更好。与此同时,公司拥有长期数据采集和高质量数据资产积累优势,可将数据迅速投入到大模型当中。

“现在拓尔思拥有全网数据1500亿,有人工整理、专家整理的数据库达30多个,主题数据110亿个,这是拓尔思能够做大模型很重要的优势。”林松涛称。

据了解,拓尔思在大模型应用方面首先选择政府、媒体和金融三个优势赛道。

在林松涛看来,做垂直领域首先要选好大模型基座,国内头部厂商自己做基座,也有一些厂商选择开源,同时还需要有数据以及在专业领域的积累,最后在大模型落地时,不仅要有技术、数据、还需要让用户知道如何应用,包括真实场景的闭环、基于用户反馈的学习等等。

“我们现在要解决的三个问题,一是实现大模型与专业知识库的融合。二是如何提升AIGC的内容质量和数据安全,特别是在内容事实核查方面。三是如何降低百亿级大模型落地的成本。”林松涛表示。

上一篇 下一篇
热文推荐 更多

拓尔思林松涛:发挥高质量数据积淀优势 打通大模型落地关键路径 全球要闻

2023-06-08

2023年校友会西安理工大学各专业排名 每日报道

2023-06-08

环球快消息!舆情速览|点10斤小龙虾上餐后称重仅5斤 门店:员工把铁盘重量一起算进去了

2023-06-08

全球资讯:茶颜悦色回应顾客喝出个镊子:掉进去没能及时发现

2023-06-08

给客户的感谢信的落款

2023-06-08

东方嘉盛涨停 全球新动态

2023-06-08

年金险加万能账户值不值得买?收益高吗?

2023-06-08

焦点消息!2023年金华体育中心体育馆藤球锦标赛座位表

2023-06-08

全国“三夏”麦收进度过半 已收冬小麦达1.64亿亩

2023-06-08

“生命墙”不能想敲就敲,安全不容忽视

2023-06-08

这恋情瓜的走向,怎么越来越离谱了...|天天微动态

2023-06-08

焦点报道:豪爵GZS150摩托车论坛(摩托车论坛)

2023-06-08

天天消息!美国前副总统彭斯竞选集会上与特朗普决裂 称“他不应成为总统”

2023-06-08

深科技:连续3日融资净买入累计4175.7万元(06-07)_环球微资讯

2023-06-08

最早江苏方言茉莉花原唱?

2023-06-08

RCEP对15个签署国全面生效 为区域经济一体化注入强劲动力|天天看热讯

2023-06-08

全球热讯:直击|卡霍夫卡水电站决堤,大水涌入市区,居民带着财物撤离

2023-06-08

当前信息:“太难了!”出境游为何“签证难”?何时能好转?

2023-06-08

搜狐汽车全球快讯 | 宁德时代遭摩根士丹利看空 目标股价下调至180元/股|每日关注

2023-06-08

语文考试结束,考生们表现如何?多图直击深圳高考首日

2023-06-08