ZDNet至顶网软件频道消息: 作为过去六届中国云计算大会会议议题的参与者、演讲嘉宾,李德毅院士可谓对国内云计算产业发展有着最直观的认识。在接受ZDNet独家专访的时候他表示:“云计算已经落地,非常接地气儿;大数据还没到完全应用落地的时候。”
谈到移动互联网时代的大数据挖掘,李德毅表示主要为网络化环境下的非结构化数据挖掘,这些数据形态反映的是那些碎片化的、异构的数据。现今数据挖掘的形式化约束越来越宽松,越来越接近互联网文化、窗口文化和社会文化中的常识或约定。移动互联网时代大数据挖掘过程中,数据的简约具有适应性,不必具有固定的特征或层次。
针对大数据挖掘,李德毅院士提出了“众挖”的概念,并表示,这也是一种服务,可以通过云的方式让更多人享用。
以下是访谈视频:
好文章,需要你的鼓励
清华团队开发DKT模型,利用视频扩散AI技术成功解决透明物体深度估计难题。该研究创建了首个透明物体视频数据集TransPhy3D,通过改造预训练视频生成模型,实现了准确的透明物体深度和法向量估计。在机器人抓取实验中,DKT将成功率提升至73%,为智能系统处理复杂视觉场景开辟新路径。
R语言在Tiobe 12月编程语言流行度指数中重返前十,排名第10位,占比1.96%。作为统计计算专用语言,R语言凭借在统计分析和大规模数据可视化方面的优势重新获得关注。尽管传统软件工程师对其语法和扩展性存在质疑,但R语言在大学和研究驱动行业中仍表现出色,在快速实验、统计建模和探索性数据分析领域具有独特优势。
字节跳动研究团队提出了专家-路由器耦合损失方法,解决混合专家模型中路由器无法准确理解专家能力的问题。该方法通过让每个专家对其代表性任务产生最强响应,同时确保代表性任务在对应专家处获得最佳处理,建立了专家与路由器的紧密联系。实验表明该方法显著提升了从30亿到150亿参数模型的性能,训练开销仅增加0.2%-0.8%,为混合专家模型优化提供了高效实用的解决方案。