在全球迈向数字经济和智能世界的今天,所有的企业和组织正依托数字化平台,以期通过各种使能技术为自身业务进行智能加持,把握市场先机,提升业务绩效。自2012年以来,大数据在全球创造了1400万个就业机会。根据今年5月中国人社部发布的一份报告显示,预计2020年年末,中国大数据行业人才需求规模将达210万。越来越多的公司增加了在大数据方面的投资,有报告称去年全球在大数据分析方面的支出超过了1800亿美元。
但与此同时,如何挖掘数据背后蕴藏的巨大价值,并将其与日新月异的AI、云、物联网等新技术完美融合?选择正确的工具,才能帮助企业和众多数据领域的专业人员达到事半功倍的效果。
JetBrains为目前各种主流编程语言提供相应的集成开发环境(IDE),作为一家专注于开发者的公司,在近期举办的华为全联接2020大会上,其技术布道师和团队工具市场经理以专题演讲的形式与参会者们分享了JetBrains给开发者们的一站式解决方案。在为开发者打造的众多高效智能工具当中,JetBrains的Big Data Tools大数据开发工具因其专业、高效、可扩展等特性受到了业内的广泛关注。
早在去年11月,JetBrains首次推出了结合Java集成开发环境(IDE)IntelliJ IDEA的Big Data Tools 大数据开发工具,同时开启早期体验计划,旨在帮助Java开发者更高效地处理大数据。今年5月,JetBrains针对早期体验计划的Big Data Tools大数据工具插件做出进一步更新,新版本的插件在此前仅适用于IntelliJ IDEA用户的基础上,现在同样可用于DataGrip和PyCharm Professional。如此,这款工具首次让基于IntelliJ平台的多种开发工具之间能够相互协同工作。这表明JetBrains在成功进军大数据开发工具领域后,正有条不紊的为数据行业的专业人员创建能涵盖更多工作场景的工具。
新版本的Big Data Tools大数据开发工具插件允许数据领域的专业人员将其所使用的工具集中到DataGrip(一站式提供数据库管理的IDE)和PyCharm(Python语言专属IDE),这意味着即使是那些不熟悉Java的用户,也能通过IDE轻松地使用Apache Spark、Hadoop的HDFS和AWS S3等工具。
对于使用Scala和Spark SQL编写Zeppelin notebook的情况,Big Data Tools 大数据开发工具插件可提供智能导航、代码补全、检查和快速修复以及在notebook内重构,无需离开IDE即可浏览、创建和运行Zeppelin notebook。该插件还允许用户在IDE工具窗口中检查Spark作业执行、查看集群环境和存储信息,以及浏览和管理HDFS、S3和其他受支持的存储文件。此外,它还支持Parquet类的分栏式存储格式。此前市场上没有便于使用分栏式文件格式的工具,这使其更显独特。
多数使用Scala开发Apache Zeppelin的数据工程师都在用IntelliJ IDEA编写Scala和Java代码,这是因其优秀的体验和智能编码辅助功能使然。因此,Apache Zeppelin与IntelliJ IDEA之间的集成很自然,现在它允许数据工程师在无需离开IDE的情况下,即可使用Zeppelin notebook、Spark应用程序和S3文件。这对于数据领域的专业人员来说变得越来越重要,因为在许多情况下,通过本机IDE使用数据工具更加舒适且高效。
JetBrains大中华区负责人李玥萱表示: “各大行业对大数据的应用不断深入,与此同时企业对合适工具的需求也与日俱增。JetBrains正在利用深厚的行业知识为开发人员、数据科学家和工程师提供最专业、高效和可扩展的工具,并将覆盖大数据开发应用的各个场景。我们相信,这将帮助中国的数据行业专业人员更快地构建大数据解决方案,并持续获得舒适的应用体验。”
好文章,需要你的鼓励
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
AI代码编辑器开发商Cursor完成23亿美元D轮融资,估值达293亿美元。Accel和Coatue领投,Google、Nvidia等参与。公司年化收入已突破10亿美元。Cursor基于微软开源VS Code打造,集成大语言模型帮助开发者编写代码和修复漏洞。其自研Composer模型采用专家混合算法,运行速度比同等质量模型快四倍。公司拥有数百万开发者用户,将用新资金推进AI研究。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。