2024-12-03 07:49来源:本站编辑
数据开发平台Encord正在超越商业分析,成为“世界上唯一的多模式人工智能数据开发平台”。
周四,该公司宣布了新的多模式数据注释功能,用于对音频和文档进行分类——所有这些都在一个界面中。此次更新扩展了Encord对医疗、计算机视觉和视频数据的现有支持。
到目前为止,人工智能聊天机器人和图像生成器相对普遍。但是比起生成文本,生成令人信服的视频或音频要困难得多。人工智能行业越来越关注多模式功能,特别是随着ChatGPT语音模式等功能的发布。
为了微调人工智能模型,你需要高质量的数据,有时甚至是非常具体的数据。基于文本的数据并不能提供这些复杂模型所需要的细微差别,而在像医学这样的高风险环境中,准确性甚至更为重要。构建者需要能够注释和评估各种数据的平台——视频、音频、图像、图表、报告、零售清单、pdf等等,理想情况下,这些平台可以集中在一个地方。Encord的一些客户使用该平台进行核磁共振扫描等医学图像,以开发更好的模型来帮助医生。
拥有高质量、注释良好的音频数据有助于建立语音和情感识别模型,甚至可以识别声音。视频和音频人工智能产品需要越来越复杂的数据支持,以实现类似人类的现实主义,无论是转录还是口型的准确性。例如,人工智能文本到视频平台synia使用Encord为其逼真的人工智能化身开发训练模型。
Encord的更新包括对文档、音频文件、视觉和医疗数据的新的注释和管理功能。通过多模态注释,人工智能团队可以定制一个界面,并排查看和编辑不同的文件类型。目前,不同的数据类型通常被隔离在多个服务和平台上,这增加了数据注释的时间和成本。encoord已经支持关键的数据注释类别,如实体识别、翻译、摘要、文本分类和情感分析。
该公司在发布会上表示:“由于缺乏集成和一致的接口来统一这些孤立的工具,团队在整个模型开发过程中获得大规模数据集的可见性非常耗时,而且通常不可能。”
有了Encord,人工智能团队可以过滤他们的数据,准确地识别和管理他们建立模型所需的内容。它的评估仪表板还可以标记妨碍模型性能的数据,以便团队可以删除或替换它。
“平均而言,Encord客户使用的数据集减少了35%,这使得模型的准确率提高了20%,”一位Encord代表通过电子邮件告诉ZDNET。
在演示中,Encord联合创始人兼总裁Ulrik Stig Hansen告诉ZDNET,他认为公司对质量和集中化的关注最终将实现人工通用智能(AGI)。