现如今人工智能这般炙手可热,放在十多年前却无人问津。许多人工智能领域的研究人员以及人工智能技术公司被打着诸如“忽悠”、“不靠谱”的标签,“卧薪尝胆”十多年,如今可以说是终于“守得花开见月明”。
尤其进入2017年,大家对于人工智能的追捧愈加明显,这从人工智能在资本市场的强劲表现就足以窥见。而作为潜心于智能语音及语言技术、人工智能技术研究18年的技术公司,科大讯飞近期在资本市场可以说是非常火爆了。
在刚刚过去的7月,科大讯飞的股价一度飙至47.92元,创下2015年6月中旬至今两年多来的新高,在板块中涨幅排名第一。而在此之前,世界著名的科技杂志《麻省理工科技评论》发布的“全球最聪明50家企业”榜单中,科大讯飞位列第6,盖过BAT的风头,成为中国9家入榜企业中的第一。
“名利双收”背后新的管理难题
看几个具体数字,目前,科大讯飞已经占据中文语音技术市场70%以上的市场份额。截至2017年7月底,讯飞开放平台日服务量超40亿人次,用户数超10亿,以科大讯飞为中心的人工智能产业生态持续构建。讯飞输入法用户超过4.3亿人,教育产品惠及师生超过8000万。同时,科大讯飞以平台加赛道的战略,正在为全行业40万家合作伙伴提供核心技术。
在这样“名利双收”的背后,科大讯飞所要面临的还有企业业务的高速发展、规模的快速扩张以及组织架构的迅速调整。
据科大讯飞CIO严峻日前在接受记者采访时介绍,围绕在智能语音和人工智能技术方面的核心研发平台,目前科大讯飞拥有三大BG(business group)和两个BU(business unit)。其中,三大BG包括教育、智慧城市和消费者,两个BU包括提供智能客服解决方案、车载环境下语音交互解决方案的平嵌事业部以及服务于公共安全的公共安全事业部。
对此,科大讯飞实行了矩阵化的管理方式,原来简单的财务管控、人力资源管控和销售管控方式开始难以满足新的管理模式需求。于是,2014年科大讯飞开始与甲骨文建立联系,并在2015年以人力资源系统为切入点展开了合作。“经过去年一整年的项目实施,目前人力资源的核心模块在科大讯飞已经很好地应用起来。而在合作过程中,我们也感受到了甲骨文在产品和技术上的实力。”严峻表示,“因此,今年我们与甲骨文又进一步在CRM产品上进行了非常深入的沟通,最终决定应用Oracle CRM系统,用于支持科大讯飞人工智能+教育软件产品直销团队与经销商团队的管理,促进销售流程优化与稳健运营,加速业务发展,提升品牌优势和客户体验。“
灵活架构匹配快速变化的组织架构和商业模式
当然,严峻也表示,CRM项目定位是公司级的应用,当下选择先从教育切入试用,是由于教育BG在直销方面有很好的基础,并且在渠道管理方面对CRM有非常迫切的需求。后续,还将在所有部门推广使用。
哪里来的信赖感?严峻总结了三个词—— “过去、现在、未来”。
看过去,甲骨文拥有几十年的企业管理软件研发经验和成功案例,对于行业的深入了解和实践是科大讯飞CRM系统落地实施的重要基础;看现在,通过实施和服务等一系列能力的评估,严峻认为甲骨文产品与科大讯飞的匹配度非常高;看未来,甲骨文产品本身的高扩展性和灵活性能够很好满足科大讯飞持续快速变化的组织架构和商业模式。
“科大讯飞是一个变化很快的企业,由于新业务方向或者新模式的变化,可能几个月我们的组织架构就要做新一轮的调整,如果系统不够灵活,就会对我们在组织架构变化过程中造成直接影响。而甲骨文的产品在这方面有非常强的灵活性,能够满足我们不管是组织架构变化,还是多维度组织架构的分析等方面的各类需求。这是科大讯飞非常看重的。”
“除此之外,我们也看到甲骨文针对于企业的产品和云解决方案等方面的持续投入,我们相信在与甲骨文的合作过程中,他能够为科大讯飞提供更加长期和稳定的支持,帮助我们在未来更加稳步和快速地成长。”严峻说。
把人工智能元素植入到应用场景中
关于甲骨文与科大讯飞的合作,甲骨文公司全球副总裁及中国区应用软件总经理潘杰君在受访时也明确指出,希望能促成更多新的合作方式,如把科大讯飞的智能语音平台与甲骨文的应用结合起来,为客户提供更加智能的产品和解决方案。
实际上,我们看到,这一两年来,面对所有人都想敲一榔头的人工智能领域,甲骨文一直没有太大的动作。被问及于此,潘杰君说,甲骨文认为人工智能并不是一个独立的产品,更重要的还是要落地,我们希望能够把人工智能的元素植入到应用场景、应用环境中,利用人工智能的技术优势为客户提供更好的服务。
“举个例子,企业在服务客户的过程中经常会涉及到现场维修、维护的工单派遣,而应用人工智能的调优技术,我们现在已经可以智能地分析出哪位工程师、针对哪些产品、在什么时间、什么样的环境中能够最快地解决客户问题,并根据分析结果派送工单。” 潘杰君介绍。
对此,严峻认为,未来人工智能、大数据、云计算三者的融合会越来越紧密,并且成为IT和信息化发展非常强大的动力。人工智能算法的复杂度倚赖于云端高性能集群,因此,为了满足人工智能在未来的发展需要,云计算也必须快速地迭代和演进,包括在底层提供更强的运算能力和网络互通;在PaaS层基于大数据和人工智能提供借口,从而让所有开发者都能享用人工智能服务;在SaaS层使用人工智能和大数据的算法提供数据分析结果,为决策提供依据。
或如潘杰君所说,这确有可能成为甲骨文与科大讯飞新的合作契机。覆盖云服务全产品线的红色巨人与人工智能领域技术龙头的结合,想必是用户极为乐见的。
好文章,需要你的鼓励
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。
这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,发现较大模型表现更好,纯强化学习训练优于监督微调加强化学习,且训练数据的类型比数量更重要。这些发现对开发既具推理能力又保持视觉准确性的AI系统具有重要意义。
这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具有任务相关性(如逻辑任务中的语法熵AUROC>0.93)。他们的轻量级信号融合方法能减少14-100%的错误,仅需最小弃权,将大语言模型驱动的形式化转变为可靠工程学科。研究揭示当模型正确理解逻辑关系时会产生稳定的语法模式,为判断何时信任模型提供了可靠指标。
来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。