日前,微软正式发布新版Edge浏览器(96.0.1054.34版本)并向用户推送。
基于微软Azure神经网络文本转语音技术,Edge支持用户实时将任意网页上的文字转换为语音。打开任意网页,点击右侧下拉菜单中的“大声朗读”(Read Aloud)按钮后Edge即可朗读全文;选中部分文本后点击鼠标右键、选择“在沉浸式阅读器中打开所选内容”(Open selection in Immersive Reader)后Edge即可朗读已选内容。Edge目前支持超过80个国家和地区的语言,提供自然逼真的不同风格、性别的音色供用户选择。

新版Edge浏览器“大声朗读”功能

新版Edge浏览器“沉浸式阅读”功能
另外,新版Edge浏览器下述功能也值得“入坑”:
还等什么,赶快登录官网下载Edge浏览器开始使用吧!
好文章,需要你的鼓励
迪士尼研究院开发了一种让双足机器人学会优雅跌倒的新技术。通过强化学习,机器人能够在跌倒时既减少冲击力保护关键部件,又达到用户指定的艺术化姿势。
这项香港科技大学等机构的联合研究提出了SQ-format数据格式,通过混合精度处理实现了大语言模型性能的显著提升。该技术能智能识别模型中的关键信息并分配相应的处理精度,在几乎不损失准确性的前提下将运行速度提升近一倍。研究包含完整的算法设计、硬件实现方案和大量实验验证,为未来AI加速器的软硬件协同设计提供了重要参考。
微软开始在最新Windows 11预览版中推出模型上下文协议(MCP)原生支持的公开预览,这使其备受瞩目的"智能代理操作系统"愿景更接近现实。该更新包含文件资源管理器和Windows设置两个连接器,允许AI代理在用户同意下访问本地文件和修改设备设置。尽管功能强大,微软仍需应对用户对其AI野心的不安和不信任情绪。
华为团队推出EMMA统一多模态架构,仅用4B参数就实现了图像理解、生成和编辑的全面突破。该系统采用32倍压缩比的高效编码器和创新的通道级连接技术,显著减少了计算量。更令人印象深刻的是,EMMA在多项基准测试中超越了参数更大的模型,在GenEval上首次达到0.91高分,展现出统一架构在多模态AI领域的巨大潜力和实用价值。