ZD至顶网软件频道消息: 在过去的几年,人们谈到企业大数据,更多是讨论企业的结构化数据,也就是存在于数据库中的企业的生产数据、交易数据、销售数据等等,这些数据存储相对集中,比较容易通过不同的数据应用提取对业务有帮助的分析价值。
目前企业普遍还没有对另一类规模更大、价值更高的数据产生足够的关注,这些数据是以各种文档、图片、视频、音频文件为代表的非结构化数据。这类数据目前处于极度分散的状态,而他们往往承载的是企业商业价值最高的知识/商业信息,这些数据的丢失、泄露或者无法访问共享都会给企业的信息安全、知识传承和业务效率带来极大的影响。
亿方云CEO程远认为, 传统的文件管理方式分为以下三个阶段:以FTP、Windows网络存储为代表的企业文件管理1.0阶段;以传统文档管理系统、内容管理系统为代表的企业文件管理2.0阶段;以企业网盘为代表的企业文件管理3.0阶段。FTP帮助企业实现了文件的基本存储,文档管理系统重点针对企业的管理需求,而企业网盘主要解决的是企业文件访问以及共享的场景,但这三代产品都无法完整覆盖企业的全部需求,并且存在明显的弊端。
随着企业在互联网时代越来越强调数据共享和办公协同,传统的文件管理系统已经无法跟上企业发展的脚步了。程远认为,新一代的企业文件管理产品(企业文件管理4.0阶段)需要满足企业信息化建设中对内容管理的诉求。
近日,亿方云发布《企业网盘选型白皮书》,从产品画像、功能剖析、技术架构评估要点、部署方式四个维度进行深度剖析。亿方云认为,未来的企业文件管理产品一定要能同时满足企业管理者和员工的需求,让两者之间找到一个很好的平衡和统一。对于企业管理者来说,这个系统要能帮助企业有效的汇聚、存储和管理所有的企业文件,实现知识的有效积累和安全保护。同时它一定是非常简单和易用的,能成为员工日常进行随时随地的文件访问、共享以及协同的基础办公工具。
不同的企业对内容管理的需求程度不同,对企业的需求进行分层,并给出在每一层的一些代表性的功能,在此基础之上企业的决策者可以根据自己的个性化需求进行延伸。《白皮书》将其分为四个层次:文件存储与传输、文件访问与应用、文件共享与协作、管理与安,并根据不同层次的功能需求进优先级评分,以此帮助企业明晰企业网盘的选型。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。