更新时间: 2023-05-31
人工智能系统有几种方法可以实现Salesforce重复数据消除。方法之一是阻塞方法,如下所示:
这种阻塞方法使这种方法具有可扩展性。它的工作方式是,每当你上传新的记录到你的Salesforce中,系统会自动将看起来“相似”的记录屏蔽在一起,这可以是名字的前三个字母或任何其他条件。
这是非常有益的,因为它减少了需要进行比较的次数。例如,假设Salesforce中有100000条记录,并且您希望上载一个包含50000条记录的Excel电子表格。传统的基于规则的重复数据消除应用程序需要将每个新记录与现有记录进行比较,这意味着需要进行5000000000次比较(100000 x 50000)。想象一下这需要多长时间,它会增加多少出错的概率。此外,我们需要记住,100000条记录只是Salesforce记录中相当有限的一部分。有很多组织拥有数十万甚至数百万的记录。因此,在尝试适应此类模型时,传统方法的可扩展性很差。
机器学习方法的优点是什么?
机器学习能提供的**好处是它能为你做所有的工作。我们在上一节中描述的主动学习方面将自动对每个字段应用所有必要的权重。这意味着不需要创建复杂的设置过程或规则。让我们看看下面的场景。假设其中一个销售代表发现了一个重复的问题,并将此问题通知Salesforce管理员。然后Salesforce管理员将继续创建一个规则,以防止将来发生此类重复。每次发现一个新的复制品使这样一个过程变得不可持续时,就必须一遍又一遍地重复这个过程。
另外,我们需要记住,Salesforce中基于重复数据消除的功能也是基于规则的,只是非常有限。例如,一次只能合并三条记录,不支持自定义对象,还有许多其他限制。机器学习只是一种更聪明的方法,因为规则的创建是简单的自动化,而人工智能和机器学习则试图重现人类的思维过程。
下一篇:RMIO-01C