ZDNet至顶网软件频道消息:code.org是一个非盈利组织,由谷歌、微软以及其他数家科技公司共同创立,它的宗旨就是让 CS(计算机科学)这门学科能够进入到全球的每一所学校中去。而据TNW报道,code.org 正在 Indiegogo 上发起一项名为“Hour of Code”的众筹项目,希望筹集 500 万美元让全球 1 亿学生能够学习编程。众筹项目的截止日期是 12 月 14 日,这个日子刚好也是“计算机科学教育周”(Computer Science Education Week)的最后一天,颇有意义。
“一小时编程”课程是 code.org 目前重点推广的项目,顾名思义,让学生在一小时内学习到基本的编程知识。code.org 表示,全球 90% 的学校并不提供相关的编程课程,而他们想完成的使命就是帮助孩子第一次接触编程。这个项目将会面向全世界开放并推广,而且不会针对任何特定的等级水平,处于任何年龄段、任何学习阶段的孩子都是他们的目标群体。他们也想借助这项运动来缩小男孩和女孩在编程学习上的差距。
谷歌、微软、Salesforce 等超过 29 家科技公司参与了 Indiegogo 上的这次众筹项目,这使得这个项目成为 Indiegogo 上有史以来最大的一个捐赠型众筹项目。Indiegogo 的众筹页面上也给出了这 500 万将用于何处的一个清单。
总的来说,大致有以下几项花费:
让 1 亿学生接触到“一小时编程”:100 万
雇佣 1 万名小学老师:150 万
雇佣 500 名初中老师:150 万
雇佣 200 名高中老师:100 万
令人高兴的是,比尔·盖茨和 LinkedIn 联合创始人 Reid Hoffman 已经承诺捐款 250 万美元,其他科技公司的创始人、管理者们也在陆续加入,这也将极大的助力该项目的成功。
好文章,需要你的鼓励
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。
这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,发现较大模型表现更好,纯强化学习训练优于监督微调加强化学习,且训练数据的类型比数量更重要。这些发现对开发既具推理能力又保持视觉准确性的AI系统具有重要意义。
这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具有任务相关性(如逻辑任务中的语法熵AUROC>0.93)。他们的轻量级信号融合方法能减少14-100%的错误,仅需最小弃权,将大语言模型驱动的形式化转变为可靠工程学科。研究揭示当模型正确理解逻辑关系时会产生稳定的语法模式,为判断何时信任模型提供了可靠指标。
来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。