公告日期:2024-10-14
证券代码:688787 证券简称:海天瑞声
北京海天瑞声科技股份有限公司
投资者关系活动记录表
编号:2024-016
投资者关系活动类别 √特定对象调研 □分析师会议
□媒体采访 □业绩说明会
□新闻发布会 □路演活动
□现场参观 □电话会议
□其他(请文字说明其他活动内容)
参与单位名称及人员姓
东吴证券 黄诗涛
名
会议时间 2024 年 10 月 10 日
会议地点 公司会议室
上市公司接待人员姓名 证券部总经理 张哲
1、数据标注行业未来会有什么样的发展趋势?
首先是更加智能化,即通过拓展算法覆盖的场景以
及算法预识别的准确率等,持续提升机器参与程度以及
人机协作效率,降低数据处理成本。
其次,随着 AI 技术不断革新,应用行业以及场景
投资者关系活动主要内 不断增加,各行业、各领域数据安全规范逐渐落地将成
容介绍 为趋势,对于以数据生产为主营业务的数据服务企业,
数据安全及合规能力将成为数据服务能力的核心评价
维度,成熟的安全合规管理体系将成为重要评价标准,
能持续跟踪法律环境变化,积极响应监管政策的企业将
具有更强的市场竞争力。
此外,随着境内、外企业的全球化扩张成为确定性
趋势以及各类客户群体扩张步伐加速,多语种能力作为支撑企业顺利出海的核心要素之一,重要意义更加凸显,具有强大语言研究能力的数据服务企业将获得更多商业机会。
另外,随着数据服务向多元化、多类型、多场景持续发展,充足、稳定且高质量的数据处理团队储备、以及更加智能化的资源配置能力,将成为数据高效、稳定交付的重要保障。
2、公司主要竞争对手有哪些?
从短期来看,公司竞对仍是传统模式下的数据服务公司,国内的主要竞争对手是一些品牌数据提供商,如数据堂、标贝以及一些新兴公司;国外的主要竞争对手是 Appen。
与竞争对手相比,海天瑞声自身还是存在显著的竞争优势的,如丰富的产品积累、成熟的数据处理技术和平台、全球化的供应链管理能力等等。另外,从公司创业历程看,由于长期与国际性科技企业合作,对数据安全和合规的重视是深入到公司运作的方方面面的。而数据安全和合规是需要投入较高的成本建设的,在日益完善的法律环境下,这方面的投入为公司带来了新的竞争壁垒,也将会为公司未来在垂直行业和政企业务拓展形成有利优势。
但从长期来看,随着训练数据需求逐渐向高品质、规模化、行业化方向转变,基于自身持续研发能力建设的数据生产智能化程度将成为数据服务商的核心竞争力,因此,未来诸如 Scale AI 这类具有更强技术属性的同业公司将成为海天的主要竞争对手,为此海天自身已经开始在研发、人才等方面大规模持续投入,为未来竞争提前布局。
3、训练数据的生产过程是什么样的?
训练数据生产过程主要包括四个环节:设计(训练数据集结构设计)、采集(获取原料数据)、加工(数据标注)及质检(各环节数据质量、加工质量检测)
① 设计——训练数据集结构设计
在设计环节中,通过考虑算法模型的具体应用领域、应用场景以及预期实现的训练效果,反过来确定训练数据集内的数据类型、数量、比例分布等,相应确定原料数据的采集要求,为后续采集工作奠定基础。以语音识别、语音合成领域的训练数据集为例,在原料数据的采集环节,发音人(被采集对象)需要朗读公司提供的基础语料,并用指定的录音设备录制以形成原料音频数据。因此,在设计阶段,公司……
[点击查看PDF原文]
提示:本网不保证其真实性和客观性,一切有关该股的有效信息,以交易所的公告为准,敬请投资者注意风险。