至顶网软件与服务频道消息: 你的公司真的还需要更多数据?确定吗?如果与众多其他企业一样,你的公司收集的数据量早已超出了必要或者说能够处理的极限,那么不仅有可能产生不必要的存储成本,更有可能导致后续安全及隐私问题。事实证明,敏捷、精简的数字化转型并不需要过多数据,只是对数据质量提出了更多要求。那么,我们到底该如何区分、准确判断?
首先,我们先来聊聊最重要的问题——云计算。在这个迷信“大数据里肯定有”的时代,人们确实很容易相信自己收集的数据越多,企业绩效就越好。毕竟,咱们都需要数据湖,不是吗?但残酷的现实告诉我们,企业收集到的超过半数数据只能算是“暗”数据。暗数据是什么?简单来讲,就是企业能够收集、处理以及存储,但就是没法实际使用的信息资产。它们一来,数据湖就变成数据沼泽了,大家早晚会陷在里头动弹不得。
多项调查显示,平均而言,全部收集数据中有55%属于数据企业不知道该如何使用、甚至不确定是否属于正常收集内容的部分。在美国,有三分之一企业表示这一比例高达75%。令人震惊吧?另外,收集这么多数据也是种不负责任的行为,因为我们收集的每一条记录,都有可能有违客户利益或者带来真实损害。
下面来看几项提示,我们可以借此判断自己到底该收集哪些数据,同时明确客户为什么有必要积极参与数据收集流程。
注于最小可行数据量
在数字化转型当中,少即是多。与其关注能够收集到多少数据,不如重视怎样利用尽可能少的数据获得最有意义的结论。我们真的需要客户的确切出生日期?还是说大致了解到某月或者某日就够了?我们真的需要详尽的居住地址,还是邮政编码就能基本解决问题?大家应该对数据的收集流程抱有疑问,探索那些我们以往没有发现的优化空间。
建立数据图谱
很多朋友甚至不清楚自己需要收集多少数据,对吧?另外,谁有权使用这些数据?建立起清晰的数据图谱,确保我们的系统不致被“暗数据”快速塞满。
想想:如果我们不收集XX数据,会产生哪些影响?
很多企业都在一味强调自己有机会收集哪些新数据。但是,为什么就没人关心哪些数据没必要收集呢?正如前文所述,最重要的问题,其实是我们是否真的需要这些数据。比如说,真的有必要了解客户姓什么、结没结婚、个人净值?我们真的需要计算他们在网站上待了多长时间?虽然答案有可能是肯定的,但也有可能是否定的,具体视你的业务方向而定。如果在收集的数据中看不到直接关联,请考虑停止收集。如果客户都不知道你在收集,那就更得谨慎考量了。
保持透明
再来具体聊聊收集的问题,你的客户知道你在收集他们的数据吗?他们知道自己在移动应用上申请每周优惠券时,自己需要付出的不仅是姓名与电子邮件地址,同时还包括自己在商店中的所有浏览活动吗?如果答案是不知道,那请各位花点时间,认真思考自己到底存在哪些可能有违客户意愿的数据收集活动。虽然收集这类数据也许能帮助大家改善长期客户体验,但这是否会以牺牲客户忠诚度为代价?别偷偷收集信息,大大方方承认、保持政策透明。最重要的,是要让您的客户清楚你为什么这样做、这样做能够为他们提供怎样的体验。以这些理由为基础,允许客户自由选择是否接受。
作为CMO,出于上述理由,请你务必亲自参与隐私政策的规划与制定。你需要明确自己能够收集哪些数据,同时告知客户为什么要收集这些数据。
充分考虑企业与客户在数据关系中的定位
作为企业,大家能够从收集到的数据中获取收益,或者至少是希望获取收益。但是,我们要如何回馈客户呢?对大多数公司来说,基本就是利用数据为客户提供更具个性化的购物体验——包括更符合个人喜好的优惠与激励政策、更轻松的购物过程等等。但是,我们收集的数据是否真能帮助我们达成这个目标?我们真的在一直关注这些回馈内容吗?恐怕未必。根据我的观察,很多企业在收集数据的道路上迷失了自我,忘记了这项工作的终极目标:改善客户体验。审视数据关系,同时诚实地说明自己在哪些位置收集(或者不收集)数据。
这里我要提醒一句:从长远来看,我们收集的每一个数据点,同时也针是需要存储、保护同时及时销毁的对象。近期网上流出多达2亿份客户记录(可能是由Experian收集,并出售给第三方市场营销机构的),其内容涵盖客户的宗教信仰、收入、净值、性别以及电话号码。营销企业真的需要这么多信息吗?当然不是!但是,这一切现在都能通过暗网轻松获取。从这个角度来讲,只要能够消除不必要的数据收集,我们相当于解决了潜在的安全问题,并从起步阶段就节约下大量存储预算,同时腾出时间处理那些更有现实意义的工作。
是的,有时候算法这东西很麻烦,有时候我们在找到最佳算法之前没法确定自己到底需要收集哪些类型的数据。但是在找到之后,请马上重新组合、撤销不必要的收集行为、承诺只收集必要的内容,并与客户充分交流我们这么做的原因。可能跟很多朋友的既定思路不同,当你的企业不再把收集数据当成唯一的目标时,客户反而会更加忠诚。
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。