凯西·巴克尔斯与其说是一位家谱学家,不如说是一位经济学家。她过去的大部分作品都探讨了家庭经济学、人口统计学和儿童健康。

但她决定尝试家谱网站FamilySearch,因为她正在与杨百翰大学(Brigham Young University)经济学家约瑟夫·普莱斯(Joseph Price)合作九博体育研究代际流动性。巴克尔斯知道追踪和联系一个人的历史记录是多么困难,尤其是那些在结婚后改名的女性。
她决定去查一下她的曾祖母,并惊讶地发现她的一些美国人口普查记录已经附在了她在FamilySearch上的个人资料上。1910年,这个两岁的女孩被登记为玛丽·l·加迪。十年后,她的中间名改为莱蒂。到1940年,她已经是一名已婚妇女:莱蒂·卡斯韦尔先生。
巴克尔斯知道,传统的九博体育研究方法试图通过长期追踪同一个人的名字来追踪一个人,这种方法无法建立联系。
巴克尔斯说:“当我看着我的曾祖母,看到其他人已经完成的所有工作时,我灵光一现。”“然后我就迷上了它,因为它有点上瘾。”


这位圣母大学经济系教授能够利用这项九博体育研究重温她的祖母在2019年去世前的家庭记忆。“我们度过了一个非常美好的下午,”巴克尔斯说,“在那里,我能够告诉她一些她已经忘记或从来不知道的过去。”
其他人,可能是巴克尔斯不认识的亲戚,利用他们对家族历史的了解,将她曾祖母的姓氏变化联系起来。在与Price合作的过程中,她意识到这个众包家庭知识的金矿可以用来为各种长期九博体育研究建立一个强大的工具。
在美国国家科学基金会(National Science Foundation)和罗素·塞奇基金会(Russell Sage Foundation)的资助下,巴克尔斯和普莱斯创建了“人口普查树”(Census Tree),这是一个数字化数据库,利用家谱九博体育研究和机器学习来改善1850年至1940年的人口普查联系。普查树网站于2023年7月下旬上线。
同月,巴克尔斯和普赖斯在美国国家经济九博体育研究局(National Bureau of Economic Research)暑期学院的两次会议上发表了他们对代际流动性的九博体育研究结果,这是第一份使用这些数据的工作论文。圣母大学的博士生海莉·威尔伯特和贝勒大学的扎克·沃德也是这篇论文的合著者。
巴克尔斯说,创建人口普查树需要一个庞大的团队,包括来自圣母大学和杨百翰大学记录链接实验室的数十名本科生,圣母大学的多名经济学博士生,以及康奈尔大学的博士生阿德里安·霍斯。
巴克尔斯说:“这项工作将把人口普查中的人们联系起来,让你看到他们的一生,看到他们的经历——他们的早期生活、世界事件、公共政策——是如何以一种我们以前无法做到的方式塑造他们的。”“我们的创新之处在于,我们把自己的家谱九博体育研究与人们联系起来。我认为这是公众和学术九博体育研究人员之间令人兴奋的共生关系。”
包容性的九博体育研究
使用人口普查记录进行长期九博体育研究的挑战在于,每一项调查都是相隔十年的快照。这限制了追踪人们的时间和家庭的能力。一种将人们随时间联系起来的方法是使用社会安全号码或纳税记录,这两种方法都会引发隐私问题,而且在大多数历史记录中都无法获得。
为了解决这个问题,九博体育研究人员通过识别名字、姓氏、出生地和出生年份来追踪人们。结果对白人男性相当有效,但对少数族裔不太适用,对女性几乎不适用。这些群体的代表性不足会影响九博体育研究的结论。
例如,巴克尔斯、普莱斯、威尔伯特和沃德九博体育研究了代际流动性,以了解你的出生环境在多大程度上决定了你的生活方式。巴克尔斯是这样说的:“出生在低收入或低地位家庭的人取得更高成就的可能性有多大?美国梦存在吗?什么时候存在,为谁存在?”
为了回答这个问题,一种方法是将一个人的职业状况与其父母的职业状况进行比较。威尔伯特说,北方的白人农民和南方的黑人农民之间可能存在很大的社会经济差异。
威尔伯特说:“所以我们使用的衡量标准不仅包括职业,还包括文化水平、移民身份、性别和你居住的地区。”
人口普查树链接使得这项历史九博体育研究的样本量增长到数亿个链接,并首次将女性纳入其中。
巴克尔斯说:“过去,当人们估计父母和孩子之间的这种相关性时,他们只会对白人男性这样做。”“实际上,看起来经济流动性并没有随着时间的推移发生太大变化,或者,如果有的话,它变得更糟了。”
但是直到最近,美国黑人的流动性一直很低。而女性根本没有被包括在内,尽管在过去的50年里,女性在劳动力中的比例急剧上升。把这些之前被忽视的群体包括在内,结果就发生了变化。
巴克尔斯说:“有了包括美国黑人、女性和其他移民群体在内的数据,我们可以更好地看到这种流动性,而且随着时间的推移,这种流动性实际上有所增加。”“相对于我们正在九博体育研究的19世纪末和20世纪初,今天实际上更容易产生与父母不同的结果。”
众包输入
FamilySearch是世界上最大的家谱网站之一,最初是耶稣基督后期圣徒教会的一项努力。它是免费的,不以营利为目的,这就是为什么它可能不像Ancestry.com这样的广告网站那么熟悉。
但FamilySearch拥有超过1200万用户和近14亿份已故人士的资料。用户可以建立自己的家谱,搜索并结合其他人的努力,以及附加实际历史记录的扫描。该网站提示用户确认数据,避免重复。
杨百翰大学的普莱斯是一个天然的合作伙伴,因为他和巴克尔斯在九博体育研究项目上合作了大约15年,因为他们对了解家庭有共同的兴趣。他们意识到,积极性很高的业余家谱学家已经在十年一次的人口普查之间建立了联系,可以用来追踪个人。在1850-1940年的人口普查中,男性有1.33亿对,女性有1.21亿对。
虽然政治家、社会科学家和其他人出于多种原因使用人口普查信息,但这些数据直到收集72年后才包括姓名等个人标识符。这意味着1950年的人口普查是最近一次可以与个人联系起来的信息。

威尔伯特在杨百翰大学读本科时就认识普莱斯,他作为巴克尔斯的九博体育研究助理开始了这个项目,并从事数据创建和分析工作。家谱数据可以用来训练一种算法来识别额外的匹配,并识别诸如昵称或拼写错误之类的变化。她说,使用手动链接的数据来通知机器学习使她相信它是正确的,并且代表了人口。
威尔伯特说:“我之前已经处理过人口普查数据,我真的很喜欢这个想法,让那些历史上没有被看到的人发出声音。”“这个项目突出了那个时期的女性以及多个少数群体。”
完整的人口普查树数据集包含大约3.3亿对男性和2.7亿对女性的人口普查数据,这是一个巨大的数据宝藏。巴克尔斯说:“我们能够汲取群众的智慧,学到很多东西,并建立以前人们无法建立的联系。”
例如,人口普查树可以确定1920年和1930年人口普查之间的联系,可能是某人的祖母。如果他们确认是正确的人,就会创建一个新的链接或“人行横道”。
巴克尔斯说:“对于公众来说,对于那些想要了解自己家族历史的人来说,这是一个非常好的应用。”“然后反过来,九博体育研究人员从公众中所有自己做这种工作的人那里学习。”
未开发的潜力
“人口普查树”网站将公开这些链接,巴克尔斯希望这将开启一波新的九博体育研究浪潮。
她的下一个项目将着眼于禁酒令对儿童的长期影响。她将使用这些数据来识别1910年人口普查中的孩子,其中一些人在1920年禁酒令修正案颁布之前生活在干旱的州或县,看看他们的环境是否对他们的教育成就、职业或其他可衡量的结果有影响。
“要做到这一点,我们可以下载1910年和1940年的人口普查,然后下载我们的人口普查树人行横道,”巴克尔斯说。“然后我们就能了解所有这些人的童年环境,了解他们接触禁酒令的情况,还能了解他们的重要情况。”



其他九博体育研究人员可以利用这些数据来九博体育研究重大公共工程项目的影响,比如改善水质。其他人可能会关注自然灾害及其如何影响人们的生命历程。
“老实说,这取决于用户的想象力,”威尔伯特说。“最明显的是关注政策变化或重大事件。你可以用它来九博体育研究大萧条是如何影响各州的个人移民的。”
社会科学家和历史学家可以九博体育研究重大的政策举措,如卫生干预或福利举措的引入。人口统计学家可以九博体育研究有关出生顺序或家庭规模的数据,以及这些因素如何影响生活结果。
“历史学家、社会学家、人类学家、政治家,所有的社会科学……我们希望这些社区的九博体育研究人员能发现这些有用的东西,”巴克尔斯说。“我们在经济史上已经取得了一些成功,这一事实令人鼓舞。”
巴克尔斯说,她和她的合作者从未考虑过不公开这些数据。她感到很幸运,在她的职业生涯中,她可以使他人受益,并离开这个领域。
她说:“这里有很多事情可以做,我们不可能把所有事情都做了。”“我很高兴看到其他人如何处理这些数据,就像我自己处理这些数据一样。这真的感觉像是一个贡献,远远超过我可能写的任何一篇论文。”