至顶网软件频道消息:AWS峰会星期一在纽约市开幕,AWS在峰会开幕时发布了一系列公告。亚马逊云推出了新的东西,其中的一个工具是要试图阻止诸如用户个人记录等敏感信息的泄露,其他工具还包括文件迁移和索引实用程序以及配置和密钥管理系统。下面来过一遍网络巨人亚马逊宣布推出的东西。
用于数据筛选Macie'机器学习'
AWS揭开Macie的面纱:即是说,记者被告知,Macie可对用户的数据进行分类,以确定哪些数据涉及个人信息或知识产权,在由黑客导致的异常访问时会发出警报,比如在黑客从云用户实例中泄露数据时。
这是一个不错的举措,原因是配置不当的S3泄漏了许多敏感数据, 例如1400万Verizon用户的记录曾被泄漏,该举措或许有助于各机构加固自己的安全。根AWS介绍,Macie有四个部分,每个部分可以
·分析数据、对数据分类及处理数据,进而达到了解历史模式、数据用户认证、数据访问位置和访问次数的目的。
·积极地监控使用日志数据并检测异常情况的出现,还可以通过CloudWatch事件和Lambda自动解决已被报告的问题。
·提供存储数据细节的管理可视性,同时,无需手动客户输入即可提供即时保护。
·允许做出满足各种报告和警报管理需求的管理配置。
Macie显示的存储文件里的“风险级别”概述
记者了解到,管理员可以设置一套规则,进而控制S3访问和存储。如此,在出现非授权访问或信息被移动时,或者说在出现与典型常规模式相悖时触发警报。要得到这种保护客户的付费将基于Macie处理的S3及Macie分析的CloudTrail事件数量。
AWS Glue
普通用户现在可以用Glue服务了,Glue服务可以将S3、Redshift和RDS数据存储与AWS,、EC2的查询和分析工具以自动方式连起来。这将有助于开发人员编写代码,他们可以执行提取、转换和加载(ETL)等任务,例如分配元数据标签和整理信息进行分析。
AWS在谈到Glue时表示,“提取来自各种来源的数据、将其归一化并将其加载到数据存储中,这就是数据集成,在分析项目中,数据集成通常占执行项目所需时间的75%。”
AWS表示,“客户可能要花几个月进行人手编码和编辑ETL脚本,随着数据量的增长和新数据源的增加,这些脚本会变得更复杂,也更容易出错。”
亚马逊表示,客户可以通过AWS管理控制台选择需要分析的存储数据及使用Glue服务。Glue然后就可以分析数据并创建可以用于脚本处理的标签和表。
AWS按Glue在分析和加载数据时使用的计算时间和资源进行收费。
移动数据的迁移中心
顾名思义,迁移中心(Migration Hub)服务是让管理员和开发人员在数据从本地存储迁移到亚马逊的云时跟踪数据经过的步骤。
迁移中心会显示迁移进度,以及跟踪从数据中心到AWS的应用迁移。
将服务器移动到云里的各个步骤
迁移中心服务可用于放置在任何AWS区里的数据(迁移中心服务本身的托管地是美国俄勒冈州),并且是免费的,这样做有它的道理,因为整个迁移中心工具的想法就是要是让公司尽快进入云端及付费买AWS服务。
EFS数据的加密功能
AWS弹性文件系统(EFS)正式发布一年后,现在已经有了加密数据的功能。
加密可使用AWS密钥或利用AWS管理服务和AES-256算法制作的本地密钥。新的EFS系统在创建时就会启动加密。
AWS S3的配置规则
顾名思义,AWS配置规则允许将预先写下的或自定义的规则置于AWS实例上。然后这些规则就可以自动应用到允许或阻止诸如公共读/写访问之类的事情上。
AWS现在正在将使用规则的功能扩展到S3。每个规则配置功能的实施和监测每月花费为2美元。
第二代CloudHSM
CloudHSM(硬件安全模块)服务允许客户为自己的AWS数据生成和管理自己的安全密钥。
由于CloudHSM最新的更新,CloudHSM现在已经可以使用完全管理了,管理员可以设定时间将自己加密的密钥备份到S3存储区。亚马逊还为HSM添加了现用现付定价计划的选项,并增加了生成更复杂的FIPS 140-2 3级密钥的功能。
该服务现在也可以通过AWS管理控制台或命令行界面进行管理。
好文章,需要你的鼓励
这项由东京科学技术大学等机构联合发布的研究提出了UMoE架构,通过重新设计注意力机制,实现了注意力层和前馈网络层的专家参数共享。该方法在多个数据集上显著优于现有的MoE方法,同时保持了较低的计算开销,为大语言模型的高效扩展提供了新思路。
当前企业面临引入AI的机遇与挑战。管理层需要了解机器学习算法基础,包括线性回归、神经网络等核心技术。专家建议从小规模试点开始,优先选择高影响用例,投资数据治理,提升员工技能。对于影子IT现象,应将其视为机会而非问题,建立治理流程将有效工具正式化。成功的AI采用需要明确目标、跨部门协作、变革管理和持续学习社区建设。
小米团队开发的MiMo-7B模型证明了AI领域"小而精"路线的可行性。这个仅有70亿参数的模型通过创新的预训练数据处理、三阶段训练策略和强化学习优化,在数学推理和编程任务上超越了320亿参数的大模型,甚至在某些指标上击败OpenAI o1-mini。研究团队还开发了高效的训练基础设施,将训练速度提升2.29倍。该成果已完全开源,为AI民主化发展提供了新思路。