Da das Projekt auch die historische Komponente berücksichtigen soll, sollen auch entsprechende Daten ausgewertet werden.

Die für das Projekt im Grunde geeignetste historische Quelle wären die Volkszählungsdaten des Großherzogtums Luxemburg aus dem Jahr 1843. Von allen Einwohnern wurden Wohnadresse, Alter, Zivilstand, Geburtsort und Beruf angegeben. Die Daten sind vollständig und befinden sich auf Mikrofilm im Luxemburger Nationalarchiv, doch auch diese Daten haben einen Haken: Sie müssten vom Mikrofilm kopiert und abgetippt werden, was aber aus Zeitgründen nicht geleistet werden kann. Aber es können immerhin stichprobemäßige Untersuchungen vorgenommen werden. Das Problem der mangelnden Vollständigkeit wird dabei stets im Hintergrund behalten.

Zweite Wahl für das Projekt bleiben daher die Volkszählungsdaten aus dem Jahr 1880. Die Zählungslisten sind im Original nicht mehr verfügbar, doch sie bildeten die Grundlage für „Die Familien-Namen des Grossherzogthums Luxemburg“ von Nik. Müller aus dem Jahr 1887. Es handelt sich um eine alphabetische Auflistung von insgesamt 8.613 Familiennamen inklusive Angabe der Häufigkeit. Die Zahl der Namenträger beträgt insgesamt 194.348. Der Nachteil ist jedoch, dass die Familiennamen nicht verortet sind. Somit kann nur festgestellt werden, dass und wie oft ein Familienname existierte, doch über dessen Verbreitung ist nichts zu erfahren.

Müller, Nik.: Die Familien-Namen des Grossherzogthums Luxemburg, Luxemburg 1887, S. 35.

Was die zeitgenössischen Daten für Luxemburg betrifft, so dienen derzeit die Telefonbuchdaten der luxemburgischen Telekom aus dem Jahr 2009 als Grundlage. Insgesamt sind es über 245.000 Namenträger mit 36.300 verschiedenen Namen. Diese Zahl entspricht, bei einer Einwohnerzahl von 500.000, knapp der Hälfte.

Für Deutschland wurden die Telefonbuchdaten der Deutschen Telekom aus dem Jahr 2009 erworben. Insgesamt umfasst der Datensatz gut 23 Millionen 500.000 Namenträger mit über einer Million 300.000 verschiedenen Namen.

Für Belgien wurde das Personenstandsverzeichnis aus dem Jahr 2008 beantragt. Dieses umfasst insgesamt über 10 Millionen 500.000 Namenträger mit knapp 500.000 verschiedenen Einzelnamen. Die Daten von Belgien sind praktisch vollständig, weil die Zahl der Namenträger auch jener der Einwohner entspricht.

Für Frankreich stehen uns die Daten der Geburtsregister vom Institut National des Statistiques et des Études Économiques (INSEE) zur Verfügung. Konkret geht es um einen geschlossenen Datensatz für den Zeitraum 1991–2001. Die Daten dürften in Bälde für das Projekt bereitgestellt werden.