>自动签名验证软件有可能剥夺美国选民的选举权
自动签名验证软件有可能剥夺美国选民的选举权
2020-11-05
www.jnmtv.cn 编辑:济南全搜索
截至10月初,在美国大选之前,已向47个州和哥伦比亚特区的美国选民请求或发送了逾8420万张缺席选票。据一些估计,佛罗里达州的摇摆状态已经使加利福尼亚州100万的总数翻了一番,在截至11月3日的几周中,近200万选民投票投递了选票。
核实邮寄选票的延迟将延缓选举进程,诸如处理选票(核实选民并将其信息与选票分离)之类的任务预计将比往年花费更长的时间。现有技术可以加快某些流程,例如将选票信封上的签名与选民记录进行匹配的软件。(三十三个州要求对选民的签名进行验证。)但是,许多人质疑该软件的基础算法是否可能偏向某些选民群体。
签名验证如何工作
用于验证选票上签名的算法类别称为“离线”签名验证,因为它在没有实时信息(例如笔的向下压力)时依赖于签名图像。离线签名验证算法在尝试捕获两种特征类型的数据集上进行了训练:描述整个特征的全局特征和描述特征的各个部分(如对称性和笔划方向)的局部特征。
有关自动签名验证的一些研究已经发表,最近由台湾中央警察大学法医学系发表。研究发现,在国际文档分析和识别会议上在开源数据集上训练的算法达到了94.37%至99.96%的准确性。一份更全面的论文发表在《EURASIP信号处理进展杂志》上,得出的结论是,匹配算法的准确性取决于所使用的数据。识别率的范围从1,000名作家的样本中训练的算法的74.3%到657名作家数据集上训练的算法的96.7%。
波特娅·艾伦·凯尔(Portia Allen-Kyle)领导美国公民自由联盟(ACLU)阿拉巴马州的非诉讼倡导工作。她指出,自动签名匹配软件通常接受单语言(即英语)手写训练,以完善算法以实现最佳匹配。某些选民,例如那些患有精神或身体残疾,与压力有关的疾病或不使用英语写作的选民,可能会被拒绝投票的风险更高。甚至连名字和连字符都短的选民也处于不利地位,因为在签名上出现较少“转折点和交叉点”的错误更加普遍。
根据NBC的数据,由于签名差异,在2016年和2018年的选举中没有超过750,000的缺席选票。美国公民自由联盟(ACLU)最近的一项调查发现,在2018年,佛罗里达州有色人种在缺席选民中所占比例不到28%,但在所有被拒绝的选票中占47%,州外和军事家属的拒绝率也成比例地更高。
部署的签名验证软件的基准仍然难以确定,但斯坦福大学法律与政策实验室自动化发布的2020年研究发现,加利福尼亚州的签名匹配系统在缺乏人工审查的县将拒绝率提高了1.7点(74%)。艾伦·凯尔(Allen-Kyle)和监控技术监督项目联合创始人利兹·奥沙利文(Liz O'Sullivan)指出,许多选民现在在汽车代理商处注册,在那里他们的签名使用签名板进行数字化,并且这些签名看起来与手写在纸上的签名有所不同,因为人们可以动手不同的是,因为垫的分辨率较低。
“即使从非技术角度来看,由AI或任何形式的自动化技术支持的签名验证也更有可能标记经历过更名的人员。这意味着,已婚妇女,跨性别人士或家庭暴力幸存者都将有不成比例的投票率。” O'Sullivan通过电子邮件告诉VentureBeat。
软件厂商
据路透社报道,八个州中至少有29个县在邮寄投票中使用AI,以减轻执行签名规则的工作人员的工作量。大部分软件来自Parascript,这是科罗拉多州的文档捕获和识别解决方案开发商。
为了解决选票信封设计和扫描设备上签名空间等方面的不可预测性,Parascript说,其软件允许选举官员设置自己的最低分数来批准签名。据路透社报道,在科罗拉多州,性能差异很明显,Parascript的软件批准了道格拉斯县40%的签名,丹佛县20%的签名和拉里默50%的签名。据报道,当亚当斯县将签名空间装在信封上,产生更多可读图像时,批准率猛增,而拉里默的百分比则下降,因为更多的签名匹配来自模糊的机动车记录。
当自动验证触发拒绝时,某些州会提供追索权。在佛罗里达州萨拉索塔县,官员们给选票受到挑战的选民写了一封信,并试图通过短信或电话提醒他们,如果该县有他们的电话号码。在佛罗里达州以外,有17个州要求在签名或差异缺失时通知选民,并给他们纠正的机会-尽管协议有所不同。一个研究由佛罗里达大学的研究人员发表的发现,较小的县往往只是简单的邮件通知,可能不投票截止日期前收到。
缺乏透明度加剧了自动签名验证所固有的挑战。作为全国信息交换所和选举管理信息资源的美国选举援助委员会表示,应仅将软件设置为接受近乎完美的签名匹配,而人类应仔细检查样本。但是委员会并没有列出可接受的错误率或样本数量,并且不需要自动签名验证的供应商(如Parascript)公布其错误率。
倡导组织继续在州签名验证过程中提出法律挑战。执政党对这些诉讼之一,宾夕法尼亚州最高法院上周五决定,如果选民的签名看起来与他们的登记表上的一个不同的邮寄选票不能被拒绝。
O'Sullivan说:“如果软件使用图像识别,则可能是某种神经网络。”“这些都受到所有常见偏见的影响-训练数据中没有充分体现的任何事情都将变得更糟。想想移民的名字,尤其是那些带有非英语字符的名字,包括口音标记。” O'Sullivan告诉VentureBeat。“但是这些算法不适用于公众。我们如何测试它们?我们如何信任他们的主张?这就是为什么必须公开提供公共服务和独立审核机构使用的工具来验证这些测试的原因。”