至顶网软件频道消息:
2017年9月9日,由Cloudera组织,联通小沃科技和至顶网联合主办的Wrangle Conference活动在上海正式举行。Wrangle Conference 是一个只关乎数据科学的社区会议,从原则到实践到应用,跨各行各业。
近几年,中国的数据科学家牛人辈出,但尚无一个纯技术非商业的交流活动为大家分享这些牛人的新知心得,并提供一个同行间交流学习的平台。数据科学家都在做什么,如何减少数据整理中的繁复人工工作,金融业如何改进数据驱动,IoT采集的数据可以干什么,又新出现了哪些数据科学的工具,等等,Cloudera在硅谷湾区组织过三年Wrangle Conference之后,希望将Wrangle带到中国来讨论这些只关乎数据科学的问题。
在本次会议上,Cloudera资深架构师 陆锋与大家一同讨论并演示了如何在Cloudera数据科学家工作台中配置使用TensorFlow做深度学习,包括基于GPU以及基于Spark的使用方式。
英特尔的机器学习和大数据软件工程师 张尧,演示了大数据用户和数据科学家如何使用BigDL以分布式方式对海量数据进行深度学习分析(如图像识别、对象检测、NLP等)。
数据科学家 康祖令博士在专题报告中,从算法模型的角色论述深度学习在推荐领域的最新发展方向,另一方面同时向听众介绍如何在CDSW平台上实现这一基于深度学习的推荐模型。
最后,小沃科技大数据架构师 何驾澍向大家介绍了如何基于运营商海量的用户的人口学属性、行为数据来帮助内外客户做出有效的经营决策决策:包括联通DMP平台,行业洞察报告,及风控服务。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
伊尔德兹技术大学团队通过词典手术和离线蒸馏,以不足20美元成本打造出专为土耳其语优化的200M参数句子嵌入模型,在语义相似度任务上超越了参数量更大的原版教师模型。