无障碍链接

中国时间: 08:57 2016年12月08日星期四

美执法人员利用数据挖掘信息(04年4月27日) - 2004-04-28


美国执法人员利用数据挖掘技术,在成百上千万条记录中搜索,寻找有关恐怖分子的信息。所谓数据挖掘技术,就是在电子数据库里寻找可疑的信息模式。赞成借此来搜寻犯罪记录或飞机乘客名单的人说,这会给刑侦工作带来一场革命,但这种技术也不是没有争议。

毫无疑问,21世纪是信息的时代。掌握和储存信息能力的进步让今天的社会发生了巨变,从金融市场到军事部门,都开始依靠信息作业。

通过提高数据的储存量,电脑在这场信息革命中发挥了重要的作用。随着大型数据库和互联网技术的出现,可以随手捻来的信息量出现了史无前例的爆炸。不过,庞杂的数据就要求先进技术手段来加以处理,数据挖掘软件也因此应运而生。

*数据挖掘软件助警方执法*

Clementine 是世界上销量最好的数据挖掘程序,通过复杂的数学程式和统计分析手段,对巨大的数据组仔细勘查。Clementine 应用广泛,从开发市场营销战略,到分析医疗临床结果,到追捕罪犯,可以说是包罗万象。

Clementine 软件的设计小组负责人希勒说:“凡是有数据,有数据问题需要解决的地方,Clementine 都能派上用场。这种软件的任务,就是帮助人们了解数据中隐含的内容,所以叫数据挖掘。”

美国维吉尼亚州里士满警察局两年多以来一直利用Clementine 追踪犯罪、简化工作并协助破案。警察局犯罪分析处处长麦丘说,Clementine 显著改变了执法作业。

麦丘说:“这确实代表了公共安全数据分析模式的转换,让我们在分析过程中加进更多的科学成份,减少想象的成份,让我们从追捕犯罪,向预料犯罪的方向发展。”

不过,Clementine这种数据挖掘软件也有很多陷阱。希勒说,虽然数据挖掘能从巨大的数据库里找到有用的信息,但是不能过度依赖这种软件,对某个案件下定论。

他说:“举例说吧,如果你在一个庞大的个人行为数据库里寻找跟犯罪相关的活动,虽然你发现某人有异常行为,但这并不能说明此人就肯定不老实,只能说明这种行为不同寻常。因此,如果单单依靠数据挖掘软件,就认定某人是罪犯,或者有可能成为恐怖分子的话,那是不合适的。”

*批评人士担心冤枉好人*

反对执法机构使用数据挖掘技术协助办案的人担心,过份依赖这种软件会冤枉好人。他们担心,随着数据挖掘程序规模的增加,出现误差或错误的机会也会增加。美国几个联邦反恐项目计划利用数据挖掘技术,对庞大的犯罪分子数据库、飞机乘客名单和其它类型的数据进行分析。保安分析专家施奈尔担心,错误恐怕在所难免。

他说:“世界上有这么多人,肯定会不断出现误报的情况。不仅反恐工作如此,我们以前在市场营销等各种领域尝试,也发现了类似问题。数据挖掘软件确实有用,但并不完全可靠,如果是根据研究结果儿向顾客寄送广告,这固然没有问题,但时如果是要逮捕什么人,就会出大问题。”

在反恐行动中依靠数据挖掘技术,搜集的信息会涉及个人隐私,这一点也遭到了反对。主张维护隐私权的人说,政府无权了解私人金融记录等信息,而且还要防止被滥用。

米切尔是美国宾州卡内基・梅隆大学的反恐技术专家。他说:“我每天通信的数据就存在我面前的电脑里,这种情况并不会让我觉得惴惴不安,因为我觉得这些数据是在我的控制之中。我觉得这个问题在很大程度上,是我希望知道什么样的人会掌握有关我的哪些信息。”

*有助于收集反恐情报*

不过,即便是反对在反恐行动中使用数据挖掘技术的人,也承认这种技术确实有用。一项政府主办的数据挖掘项目甚至受到了保安专家和个人隐私捍卫者的一致赞赏。

马里兰大学的研究人员正在建立的数据库,计划归总过去三十年里发生的七万多次恐怖主义袭击事件,以便更好地理解恐怖主义这种现象。这个项目的负责人拉弗里说,因为美国执法部门为追捕罪犯而设立的数据库是保密的,而且重点是寻找案犯,所以研究人员不能用执法部门的数据库来研究恐怖主义总的发展趋势。

拉弗里说:“虽然你可能掌握有关每个恐怖主义嫌疑人和每个被捕的恐怖分子的具体情况,但这并不能告诉你恐怖主义事件对旅游业、对国民生产总值,或是对失业率会产生什么样的经济影响。”

拉弗里说,他希望看到的是对全球恐怖主义的总体描绘,具体说就是恐怖主义对政府和执法部门的影响以及恐怖主义的演化过程。拉弗里负责兴建的数据库跟联邦政府计划建立的数据库之间的区别,主要是数据库的信息来源。

拉弗里的数据来源主要是新闻报道里的数据。他说,依靠公共消息来源,能对恐怖主义有深入了解,因为一般的犯罪分子希望掩盖犯罪,但是恐怖分子却恰恰相反,希望让所有人都知道自己的罪行,途径往往是媒体。

他说:“恐怖主义的主要目的是在媒体上曝光,所以我们觉得,大部分重要的恐怖主义事件在新闻媒体上都能找得到。在某种程度上,我们建立恐怖主义事件的数据库,比建立洗钱等犯罪的数据库容易得多,因为那些犯罪分子都想方设法掩盖罪行,不愿意引起媒体注意。”

有关专家说,这种技术是了解和防止恐怖主义的主要工具,就连反对者都承认数据挖掘技术是不会消失的,但是他们希望公众能围绕这种技术的使用继续辩论下去。

XS
SM
MD
LG