7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议在上海世博中心正式开幕。会上,人工智能的应用落地成为了热议焦点。业内大咖纷纷指出,人工智能发展既要重视大模型技术研发,更要重视大模型应用。纵观人工智能行业的发展,从热闹非凡的“百模大战”,到应用层生态的“百花齐放”,2023年AIGC产业迎来了集体爆发期。
聚焦垂直领域的应用落地
政务大模型蜜巢1.0在2023WAIC上首次亮相,因“自主安全双引擎 应用丰富落地强”的特点,令人眼前一亮。2024年,蜜度公司宣布完成生成式人工智能备案,并专注在政务、企业办公领域精耕细作,推出蜜巢3.0。据介绍,蜜巢3.0在研发生态、训练数据、模型架构层面融合改进,新增三大亮点:全流程国产化、高质量数据集、高效能混合架构,大幅提升政务场景大模型创新应用效能。
蜜度CTO、蜜度蜜巢总裁刘益东介绍到,蜜巢是面向垂直领域的大模型,相较于通用性,精度和质量更受到用户重视,所以需要不断打磨提升专业性的能力,例如蜜巢大模型的智能知识管理、文稿智能写作、智能舆情分析能力,文修的智能校对、AI润色能力等。在应用落地上,蜜巢聚焦垂直场景,从一个切入点深入挖掘,将大模型与业务流程、产品功能相结合,用较低的成本打造高效、精准的应用。
目前,蜜巢深入政府、企业办公环境,打造了20+核心应用场景,并率先在政务热线、政务智能问答、执法文书辅助写作、司法文书校对、智能伴游、宣传稿件辅助撰写等场景中打造了一批落地应用标杆。比如在政务热线应用场景中,蜜巢的能力实现了在通话中可自动解读出多条一问一答知识点,5秒内自动生成回答、将报告撰写时间的时间缩短到20分钟,以便在决策时提供数据深度挖掘分析,提高工作效率。
大模型“加速器”解决方案亮相
当前,国内仍处于热闹非凡的“百模大战”时期,背后的行业发展前景与堵点仍然是各界关注的焦点。如何帮助大模型在信息的海洋中快速找准航向,在数据的荒漠中找到高质量的“水源”?合合信息在本次大会上展示了大模型“加速器”解决方案。
据了解,在大模型训练的上游阶段,“加速器”中的文档解析引擎将助力大模型突破在书籍、论文、研报等文档中的版面解析障碍,从源头为模型训练与应用输送纯净的“燃料”,助力大模型跑得更快;“加速器”还加载了行业领先的acge文本向量化模型,助力大模型解决“已读乱回”的“幻觉”问题。
大模型技术的发展和应用,预示着更加智能化、个性化未来的到来。如果将大模型比喻为正在疾驰的科技列车,语料便是珍贵的“燃料”。对于中国的大模型企业而言,语料短缺问题更为严峻。当前英文数据集、无线表、跨页表格、复杂公式等元素的处理仍是大模型语料处理中的另一个“拦路虎”。
合合信息的文档解析引擎最快1.5秒可解析百页长文档中的文本、表格、图像等非结构化数据;同时,引擎还具备优秀的文档“理解力”,能够深度“洞察”图表内容,对研报、论文等文档中的柱状图、折线图、饼图、雷达图等十余种常见图表进行“还原”,巧妙转化大模型能够理解的markdown格式,使数据和图表的价值潜能充分释放。
合合信息智能创新事业部总经理唐琪提到,目前大模型“加速器”已被多家大模型厂商应用于金融、医学、财经、媒体等多领域。大模型技术的应用,除了模型底层技术能力,离不开与行业知识库的协作。而文档解析则是知识准确、信息提取完整的重要动能。合合信息将携手专业伙伴,共同克服这些技术和场景瓶颈,未来也希望能汇集各方力量,共同推动大模型落地行业应用的进步。