Toute personne apprenant une langue s'est retrouvée un jour face à la question « Mais comment diable utilise-t-on ce mot/cette expression ? ». Le projet Tatoeba a été fondé pour répondre au besoin de pouvoir rapidement trouver des phrases illustrant un mot ou une expression. Le tout s'articule autour d'un site web [
http://tatoeba.org], où chacun peut venir piocher des phrases dans les langues qui l'intéressent et, une fois inscrit, ajouter ses propres phrases, mais aussi traduire, corriger celles déjà existantes.
C'est d'ailleurs dans cet aspect collaboratif que réside tout l'intérêt de Tatoeba : l'ensemble des phrases a été créé/traduit par des êtres humains. Ainsi, on peut non seulement trouver des phrases « naturelles », mais aussi poser des questions sur les phrases déjà présentes, afin de savoir si telle ou telle variation est correcte, dans quel cas on utiliserait cette phrase plutôt qu'une autre, etc.
Nous avons pour l'instant plus de 400 000 phrases réparties sur 53 langues et environ 4000 audios qui proviennent d'une collaboration avec le projet Shtooka. Pour ce qui est des licences, l'ensemble des phrases et audios sont sous CC-BY2.0/FR et le site en lui même est sous AGPL v3.