Here are my restrictions:
- High priority on simple and common french words.
- Only words with 5-8 letters.
- A word is fully recognizable by typing the first 4 letters (special french characters "é-è" are considered equal to "e", for exemple "museau" and "musée" can not be together).
- Only infinitive verbs, adjectives and nouns.
- No pronouns, no adverbs, no prepositions, no conjunctions, no interjections (unless a noun/adjective is also popular than its interjection like "mince;chouette").
- No numeral adjectives.
- No words in the plural (except invariable words like "univers", or same spelling than singular like "heureux").
- No female adjectives (except words with same spelling for male and female adjectives like "magique").
- No words with several senses AND different spelling in speaking like "verre-vert", unless a word has a meaning much more popular than another like "perle" and "pairle".
- No very similar words with 1 letter of difference.
- No essentially reflexive verbs (unless a verb is also a noun like "souvenir").
- No words with "ô;â;ç;ê;œ;æ;î;ï;û;ù;à;ë;ÿ".
- No words ending by "é;ée;è;et;ai;ait".
- No demonyms.
- No words in conflict with the spelling corrections of 1990 (http://goo.gl/Y8DU4z).
- No embarrassing words (in a very, very large scope) or belonging to a particular religion.
- No identical words with the Spanish wordlist (as Y75QMO wants).
4 wordlists used:
- http://pastebin.com/Drs1HY0v (3726 words) from http://o.bacquet.free.fr/db2.htm
- http://goo.gl/ymSBeY (336531 words) from http://www.pallier.org/ressources/dicofr/dicofr.html
- http://dict.xmatiere.com/noms_communs_par_nombre_de_lettres.php
- Thomas Voegtlin's wordlist
Spelling verified with Hunspell French Dictionnary (1990 and Classique) in Notepad++, and meaning verified with https://fr.wiktionary.org and http://www.larousse.fr/ for hundreds words.
Guys can review: @ecdsa @NicolasDorier @EricLarch @nicolasbigot @pollastri-pierre
Thanks to Thomas Voegtlin for his wordlist!
Please wait before merging.
--- The following message is partially outdated because of the evolution of the wordlist. ---
J'ai défini un maximum de restrictions "raisonnables" pour qu'un individu puisse deviner le plus facilement possible un de ses mots en cas d'oubli (ou s'en souvenir facilement).
Pour les mots "embarrassants", il s'agit de mots qui peuvent être assimilés à une vilaine insulte, de certains mots relatifs à une maladie grave, à la mort, à la pauvreté, au crime, à la violence, au domaine médical, à des attitudes et bien d'autres.
J'ai fait de mon mieux pour supprimer les mots qui présentaient une ressemblance avec un autre mot, à l'oral comme à l'écrit. Plusieurs centaines de mots qui avaient une différence de 1 lettre (ou 1 lettre différente) avec un autre mot ont été supprimés. Je considère que le résultat est plutôt satisfaisant, loin d'être parfait, mais tout à fait correct. Aussi, les restrictions n°6 et 10 sont complémentaires à ce problème.
J'estime qu'il y a 1% de mots potentiellement inconnus du public (comme "quantum"), et 5% de mots avec des sens qui sont potentiellement incertains par le public (comme "fongible"). Je considère ces marges comme convenables.
Notez que certains éléments chimiques du tableau périodique sont présents, les plus populaires.
Pour une vérification plaisante, voici la version imprimable (5 pages PDF A4): https://www.dropbox.com/sh/xlq3x2anb706uw1/AADUYAqcBvkvUPdhwC2uLWmEa?dl=0
Si vous voulez vérifier en 1 lecture, focalisez-vous sur les restrictions n°2,3,5,8 et 11. Étant donné l'homogénéité de la liste (et le bon sens qu'elle doit avoir), les mots contraires aux restrictions n°1,4 et 13 devront vous sauter aux yeux. Comptez 15 minutes de lecture par page. Je recommande quand même une deuxième lecture.
J'espère que vous apprécierez cette wordlist, c'est un travail de plus de 70 heures que je n'envisageais pas de faire au début, étant donné l'ampleur et la responsabilité de la tâche.
Si un mot vous semble inapproprié, ou si vous avez des remarques à faire par rapport aux restrictions, vous pouvez m'en faire part.
Sachez aussi que si elle vous convient, elle sera intégrée dans une des prochaines versions de breadwallet avec les autres wordlists étrangères.