北京时间2023年7月5日上午,2023全球数字经济大会主论坛在北京国家会议中心开幕。在探讨主题为:围绕AI大模型的未来格局的高端对话环节,昆仑万维科技股份有限公司CEO方汉先生分享了昆仑万维开发的AI大模型在B端和C端领域的应用前景。方汉表示,昆仑万维是从2020年开始做预训练大模型的研发,是国内最早走技术路线的企业之一。
在B端领域,方汉认为数据处理和收集是目前最主要的工作。他解释说,在进行大模型预训练时,需要将所有数学题的公式转换为文本格式,并附上解题过程。随后,这些数据被输入到模型中,以使大模型真正掌握人类解题的能力。对于金融、法律、能源等行业,方汉强调大模型企业的重要任务是协助将这些行业的专有数据转换为文本格式,因为大模型只能理解文本格式的数据,而图表和公式都需要转换成文字描述。
此外,方汉还强调需要记录各行各业的商业逻辑和技术逻辑,将所有逻辑文本化后输入到大模型中,以实现大模型在各行各业中的落地。他认为这是一项艰巨的任务,但相信所有从事大模型研发的企业都在紧锣密鼓地进行这项工作。
在C端领域,方汉指出用户主要使用大模型进行工作和娱乐。在工作方面,大模型可以助力个人信息处理。通过将全世界使用各种语言撰写的人类知识转化为中文,并提供给C端客户,大模型可以在各种办公、公文写作、程序编写和学习等领域提供卓越的辅助。在娱乐方面,方汉预计,在未来3-5年内,大模型将产生更多的端到端内容制作工具,彻底改变文学、音乐、漫画、动画、短视频、长视频和影视等行业的内容生产形式和流程。这将使更多人无门槛地进入内容创作领域,极大丰富人类的娱乐生活。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。