Lebas Sébastien a écrit 257 commentaires

  • [^] # Re: Long coup de gueule

    Posté par  . En réponse à la dépêche Traduction en français du "Encourage Women in Linux HOWTO". Évalué à 2.

    mais il y avait peut-être des manières plus agréables de me le faire remarquer, non ?

    Oui, vraisemblablement. Mais cela n'aurait pas eut le même impact, et le but est bien de s'attaquer un usage qui se répand, et de faire réagir TOUT le monde, pas uniquement toi (sinon, effectivement un message plus soft aurait vraisemblablement suffit).

    c'est effectivement une ... faute

    Dire que les auteurs sont des hommes et des femmes, oui. La façon dont c'est écrit (vraiment la forme seule), tu ne feras pas croire que c'est un accident ...

    étant donné qu'il n'est *jamais* employé dans le texte (un petit grep te le dira), je ne comprends pas le reproche.

    Quand je parle de l'usage, c'est celui du mix masculin / féminin avec les tirets, pas uniquement de "auteur-e-s", hein ;)

    Un petit listing (lecture en diagonale) :
    2.4) x2
    2.5) x1 (un affreux "gen-te-s")
    2.6) x1
    2.7) x1
    2.8) x1 (d'ailleur il est étiqueté 2.9 ;) )
    2.9) x1
    3.1) x1 (le retour du "gen-te-s")
    3.5) x3
    3.8) x1
    3.11) x2
    3.12) x1 (titre, je pense aussi que le "nouveaux/nouvelles" est en trop)
    3.15) x3 (encore un "gen-te-s")
    3.16) x6 (avec un certain nombre de il/elle HS en plus)
    3.17) x1
    3.19) x2
    3.20) x1
    3.22) x1
    3.24) x5
    3.25) x2 (plus une typo sur "milieu", ligne 8, mot 3)
    4) x1
    A) x6

    Et il y en a sûrement que je n'ai pas vu ...

    Quant à "développeureuses", l'emploi exprime le fait qu'il s'agit de femmes *et* d'hommes

    Sauf qu'il n'est pas employé pour désigner des membres de LinuxChix (dans le 3.16 par exemple), mais pour des développeuses (et uniquement des femmes, ce qui est le sujet du texte)

    D'autant plus que le terme est excessivement mal choisi (très mal connoté) ;)

    Pour finir, concernant le fond de ton texte, le débat de la féminisation est long, complexe

    On est d'accord sur la débat sur la féminisation, mais pas sur le fond de mon texte.

    Le fond consiste à dire :
    - L'utilisation de cette forme d'accord (les "-e-s") est :
    - Faux
    - Génant
    - Stupide
    - Inutile
    - Et dans certains cas insultant

    Et ici, en plus, ne respecte pas le document original (emploi du double genre lorsque le texte ne parle _que_ des femmes).

    je ne crois pas pouvoir le mener de manière satisfaisante (càd de manière à déboucher sur quelque chose d'intéressant, et pas sur les poncifs habituels) sur LinuxFR

    Pourtant c'est sûrement beaucoup plus utile ici (ou ailleurs, mais en public) qu'en privé, par mail. Il y aura "un peu" de pollution, mais c'est inévitable ...
  • # Long coup de gueule

    Posté par  . En réponse à la dépêche Traduction en français du "Encourage Women in Linux HOWTO". Évalué à 10.

    Bonjour,

    Disclaimer :
    1/ le coup de gueule n'est pas dirigé contre l'auteur _en particulier_, ma s contre tous ceux qui ont le même comportement
    2/ le but n'est pas de dire "les gens qui font ça sont des cons", mais de les faire réagir à propos de ce qu'ils écrivent
    3/ Cela ne retire rien au fait qu'il est très bien d'avoir traduit ce texte ...


    Serait-il possible d'éviter ce massacre du français consistant à mettre (par exemple ici) : "auteur-e-s"

    C'est :
    - Faux
    - Génant
    - Stupide
    - Inutile
    - Et dans certains cas (ici par exemple) insultant

    Je développe :
    (je prendrais l'exemple dans la news "auteur-e-s" à chaque fois, mais je vous invite à lire particulièrement le cinquième point, "insultant")

    Faux : la forme (qui existe déja) est "auteur(e)s" (avec les réserves d'avoir le mot auteur au féminin). D'ailleurs, ici, la phrase devrait être accordée (originales n'est pas accordé avec les 2 genres).

    Génant : la lecture est coupée par les tirets - C'est un peu leur but, en fait. (Voir les règles de typographies et les différents tirets existants)

    Stupide : il me semble inutile de pointer _a chaque fois_ que les femmes font quelque chose, que ce sont des femmes qui l'ont faite. Voir le 3.11 du document, "ne pointez pas les femmes du doigt quand elles arrivent"

    Inutile : le français possède des règles de grammaires donnant priorité à un accord par rapport à l'autre. Il _fallait_ faire un choix, ce choix peut éventuellement être modifié (comme en anglais dans des livres, le pronom utilisé est maintenant souvent "her"), mais une règle existe, autant l'appliquer.

    Insultant : Prenons le "auteur-e-s". Voici un extrait du texte original :
    This document began with the verbatim recommendations of the
    women who attended the LinuxChix BOF, and was added to by many more women in
    the months following the original BOF. In other words, this HOWTO represents
    the feelings and opinions of real women involved in Linux.


    Vous aurez compris que c'est un document fait par des _femmes_. Pas des hommes et des femmes, juste des femmes. Donc, en utilisant la forme (censée respecter l'égalité) "auteur-e-s", le traducteur attribue le mérite d'un travaill fait par des femmes à des hommes. De même, cet usage dans _tout_ ou quasiment le document, déplace complètement la source de ce document, en insinuant que les hommes sont sujets aux mêmes brimades que les femmes (alors que le but de ce document est justement de montrer la différence de traitement).

    Après, il y a des traductions "féminisées" massacrées :
    développeureuse -> développeuse

    (Ce qui est quand même un comble vu le document traduit ;) )

    Enfin, vous pouvez voir un concentré de plein de critique ci-dessus dans le 3.16, troisième étoile, qui est un "bon" (je devrais plutôt dire mauvais) exemple.


    Pour finir, je vous demanderais de lire le document original pour voir :
    1/ Si les auteurs féminisent les noms.
    2/ Si les auteurs se sentent obligés de spécifier _tous_ les genres à chaque mot pouvant s'appliquer aux deux sexes
    3/ etc.

    (Indice : Ce document à été écrit par des femmes qui cherchent justement l'égalité avec les informaticiens hommes)


    Commentaire juste pour l'auteur :
    Sur le lien sur ta page web, on arrive sur le répertoire racine, c'est pas top, mais quand on va sur le répertoire pub, on tombe sur une page qui fait :
    " Bienvenu-e ..."
    Quel est l'intérêt de masculiniser ce mot (féminin) ???
  • [^] # Re: ITER

    Posté par  . En réponse au journal Pourquoi pas voter "vert" ?. Évalué à 1.

    Mauvaise foi detected !

    et doivent de toute façon être completées par une production thermique qui est elle très polluante et déstocke du Carbone.

    Ah, et qu'est ce qui empêche de compléter par la solution que tu préconise (le bois) ???? Utiliser la mauvaise réputation de la production d'énergie thermique (je pense que tu voulais dire "à partir de carburant fossile" plutôt, la combustion du bois étant _aussi_ une forme énergie thermique) en l'associant artificiellement à l'énegie nucléaire, ça s'appelle de la manipulation ;)


    Sinon, sur un post plus bas (de quelqu'un d'autre), expliquant le bilan nul en CO2 :

    Dans le CO2, le carbone vient de l'arbre et l'oxygène de l'air. Le CO2 est relâché dans l'atmosphère.
    Quand l'arbre suivant pousse, il prend le CO2 de l'air, le transforme en carbone pour faire les feuilles et le tronc et relache l'O2 dans l'atmosphère.

    (Rappel : Ce n'est seulement quand l'arbre pousse qu'il libère plus d'O2 qu'il n'en consomme, un fois qu'il ne grandit plus, le bilan s'équilibre)


    Ici, je pense que c'est un lapsus ??? Quand il grandit il consomme plus de CO2 qu'il n'en libère ? Sinon, en provoquant la replantation d'arbres tu _aggrave_ l'effet de serre ;)
  • [^] # Re: c'est plutôt des métaheuristiques

    Posté par  . En réponse au journal Algorithmes intelligents : algos génétiques, filtres bayésien etc... Évalué à 1.

    Le message d'avant est très intéressant, mais je capte pas trop son utilité dans le traitement automatique des langues ...

    Déja, le TAL ça rassemble plusieurs choses différentes ;)
    - En analyse de texte, je ne vois pas trop comment c'est utilisable ...
    - En génération de texte, il y a peut-être une utilisation possible, mais de l'ordre du détail "décoratif", alors qu'il y a encore des problèmes plus importants ...

    Enfin bon, je ne connais quand même pas le domaine à fond, mais les métaheuristiques me paraissent pas vraiment un pré-requis ;) Par contre, tu peut jeter un oeil à la théorie des graphes et aux transducteurs (même s'il n'y a pas que ça) ...

    Et puis tu verras le TAL c'est marrant, toutes les questions de type "est-ce que cette forme / phrase est correcte" sont des trolls en puissance :)

    (Et pour revenir au sujet des métaheuristiques, le recuit simulé roxor, mais si je serais bien incapable d'expliquer pourquoi ça marche aussi bien ;) )
  • [^] # tant qu'on est dans le HS ;)

    Posté par  . En réponse au journal Algorithmes intelligents : algos génétiques, filtres bayésien etc... Évalué à 4.

    traduction "intelligente" (en fonction du contexte du mot dans la phrase...)

    Je pense que tu peut supprimer le "intelligente", il va te falloir AMHA bien plus que ça ;)

    Sinon, pour l'utilisation du contexte, tu peut regarder les chaines de Markov Cachée (HMM, hidden markov model en anglais il me semble), c'est une des possibilités utilisée ...

    Bogofilter, il utilise un filtre bayesien ? Parceque à part essayer de classer ton document pour adapter le dictionnaire utilisé, je vois pas trop l'utilisation que tu veut en faire ... (mais j'ai peut être tout simplement pas saisi l'idée ;) )
  • # Google et linuxfr sont tes amis ...

    Posté par  . En réponse au journal Avis de recherche VRML. Évalué à 1.

    Tu peut regarder ce journal : http://linuxfr.org/~Fluf/9680.html(...)
    L'avant dernier commentaire, tu clique sur le lien, et tu lis la page web ;)

    Sinon, en regardant 30 secondes les pages web citées dans ton lien, les installs ont pas l'air trop complexe, hein ... (et ceux qui penseront que c'est un peu le principe d'un plug-in auront raison)
  • [^] # Re: Oula

    Posté par  . En réponse au journal Votre avis (sérieux). Évalué à 1.

    C'est un peu comme la reconnaissance automatisée d'images pédophiles.

    Pas vraiment. Le traitement de texte est beaucoup plus "facile" que le traitement d'image. De plus, pour une image pédophile, il faut avoir des critères de reconnaissance formels qui doivent être assez dur à déterminer (déja reconnaitre une image X d'une image normale est à priori pas trivial). De plus, je suppose que plusieurs images doivent varier suffisament pour empêcher (ou grandement gêner) la reconnaissance de "constantes".

    Ceci dit, il me semble qu'il y a déja des choses dans ce domaine ...

    C'est très dur d'avoir quelquechose de constant dans un discours que l'on veut discret et donc dissimulé.

    Non, car justement ce genre de discours doit avoir des éléments de repère "clairs" ... Surtout que l'on ne cherche pas à détecter le sens de ces "codes", mais juste leur présence. Et justement, c'est le genre de choses qui, une fois repéré, se détecte très bien (en sachant que le but n'est _pas_ un effacement automatique, mais juste une alerte au webmaster qui jugera par lui-même). C'est un peu (voir beaucoup) le principe des filtres bayesiens (anti-spams entre autres).

    Bref techniquement ça ne me parait pas extrèmement compliqué ... Ca existe pour les mails, est-ce que cela existe pour les forums ?

    Avec la LEN il va falloir recourir à ce type d'outils pour minimiser les coûts de ce boulot de recherche fastidieux et complètement improductif.

    Oui. Mais même sans la LEN, je détesterais avoir un forum spammé ou utilisé de cette façon, question de principe ... Et si on peut avoir un outil efficace, c'est aussi bien ;) (s'il existe déja aussi :) )
  • # Recherche de comportement "suspects"

    Posté par  . En réponse au journal Votre avis (sérieux). Évalué à 1.

    Est-ce qu'il existe des projets / scripts pour essayer de détecter ce genre de threads "suspects" (suivant apparement certaines "règles" de construction, donc détectable) ?

    (une rapide recherche sur google ne m'a pas donné grand chose, mais bon, c'est le genre de recherche avec beaucoup de bruit :( )

    Sinon, ça peut être utilie d'en faire un ...
  • # Paranoïa, réalisme, toussa ;)

    Posté par  . En réponse au journal les mails espions de didtheyreadit.com. Évalué à 0.

    combien de temps le lecteur est resté devant la page du mail

    Euh ... faudrait voir à parler de choses faisables, hein ...

    Parcequ'après on s'étonne que des gens non / peu informés pensent des choses aberrantes (style le GPS dans l'alim ;) )

    Le jour où tu me montre un script (ne faisant pas appel à une webcam ou à un système équivalent ;) ) qui te dit combien de temps je suis resté devant une page de façon fiable, chapeau !

    Un script disant combien de temps la page est restée affichée à l'écran, c'est déja plus simple ;)

    Bref, soyons précis dans ce qu'on dit / écrit, ce sera mieux pour tout le monde :)
  • # L'Extension :

    Posté par  . En réponse au journal Extensions pour Firefox. Évalué à 1.

    Je m'étonne que personne n'en ait encore parlé : FireSomething.

    Indispensable !

    Et sinon, dans la catégorie un peu plus utile, tu as les extensions de "mouse gesture" (il me semble qu'il y a en a plusieurs qui existent), c'est pas mal et quand tu connais 2-3 gesture c'est assez pratique ... Pour moi c'est un excellent complément des tabs, en particulier quand tu as une gallerie d'images ou une liste d'articles / annonces à regarder.
  • # pas compris :(

    Posté par  . En réponse au journal [long] Méls fourrés au virus de plus en plus bizarre et inquiétant.... Évalué à 2.

    Euh ... J'ai trouvé ça pas très clair (mais c'est peut-être moi qui suis mal réveillé ;) )

    1) comment un robot peut-il être assez malin pour bricoler à partir d'une adresse type "Tonton_Citron@mayakovski.fr" un champs expéditeur de forme "Tonton citron" !!?

    Je n'ai pas compris où tu voulais en venir ? La transformation est triviale (en terme de découpage de la chaine de caractère), et prendre comme expéditeur la partie avant le @ de l'adresse mail est tout à fait normal (c'est un peu le principe de la construction d'une adresse mail ;) ).

    Ou alors j'ai mal compris le problème (très possible ;) ) ?

    2) Plutôt un fichier joint camouflé avec une pseudo-url vers un site extérieur obtenu à partir de mon adresse mél véritable (ici @yahoo.fr). Retors, ces gens là sont retors...)).

    C'est plutôt ça, AMHA ... Mais j'ai pas bien compris ce que ça faisait ... L'adresse indiquée pointait sur le mail-lui même ?
  • # Re: Le microprocesseur "z" (z-cpu)

    Posté par  . En réponse au journal Le microprocesseur "z" (z-cpu). Évalué à 3.

    Extrait de sa doc :
    Tout ceci semble être bien limité : j'aurais aimé faire du free software, du free hardware, mais qui sait si une bande de bouffons ne va pas vouloir s'en emparer, en faire un concept rigoureusement propriétaire... et donc le tuer.

    Euh ... A mon avis, ré-explique lui la GPL ...

    Ce dont il a peur n'est-il pas _autorisé_ avec la licence BSD et interdit avec la GPL ????

    Ce qu'il veut, c'est que son système ne puisse pas devenir propriétaire, ou qu'il en garde le contrôle complet ?

    Dans le premier cas -> GPL
    Dans le second, une licence encore plus restrictive ...

    (Tout ça bien sûr AMA)

    Sinon, pas trop eut le temps de lire le reste (c'est quand même assez touffu ;) ), mais bon courage !
  • [^] # Re: Que prendre comme serveur ? (config + OS)

    Posté par  . En réponse au journal Que prendre comme serveur ? (config + OS). Évalué à 1.

    Oui, mais comme l'ardoise magique c'était pour faire le serveur, ça veut dire qu'il va falloir que je prenne un serveur pour piloter le serveur ;)

    Sinon, ça doit être marrant, faut juste éviter que ça reboote en plein milieu de la nuit (c'est pas très discret c'est bêtes-là il me semble :) )
  • [^] # Re: Que prendre comme serveur ? (config + OS)

    Posté par  . En réponse au journal Que prendre comme serveur ? (config + OS). Évalué à 1.

    Et c'est dispo en france ces bêtes là ? Tu as une idée du prix ?
    Parceque là, c'est pas indiqué, et que ça fait plus grossiste que revendeur aux particuliers ... (en plus, il y a pas de revendeurs indiqués en France).

    Si je me décide pour ça, j'en reparlerais ici, mais il y a peut de chances je pense (je cherche pas forcément quelquechose de silencieux, juste de discret ...)

    PS : je me permet de remettre le lien, mais en anglais cette fois-ci, pour les non germanophones que ça intéresse ;)
    http://www.pyramid.de/e/builttosuit/cigarbox.shtml(...)
  • [^] # Re: Que prendre comme serveur ? (config + OS)

    Posté par  . En réponse au journal Que prendre comme serveur ? (config + OS). Évalué à 1.

    En fait, "un peu" de bruit ça ne devrait pas me déranger ... Et je pense qu'un DD (surtout celui que j'ai déja) sera plus économique que de la RAM ou une compactFlash ;)
  • [^] # Re: GPL vs droit d'auteur

    Posté par  . En réponse au journal GPL vs droit d'auteur. Évalué à 2.

    Normalement (si j'ai bien compris) :
    - Il ne peut pas retirer ton copyright, donc tu auras _toujours_ ton nom au début de chaque fichier de code
    - Par contre, tu ne peut pas l'obliger à mentionner ton nom ailleurs

    Par contre, un petit mot avant la licence demandant (mais précisant que ce n'est en aucun cas une obligation) d'être cité dans les crédits devrait être compatible ... (a vérifier)

    (sinon www.gnu.org c'est bien hein, et la réponse est dans la FAQ sur la GPL)
  • [^] # Re: EDF : des coupures d'électricité à prévoir - Jusqu'où iront les syndicalistes ?

    Posté par  . En réponse au journal EDF : des coupures d'électricité à prévoir - Jusqu'où iront les syndicalistes ?. Évalué à 2.

    Tu as oublié avec les pleins phares et les anti-brouillards allumés ...

    Ben oui, il faut qu'ils éclairent, il y a plus de lumière, et en plus qu'on les voie (c'est trop discret les 4x4) ...
  • [^] # Re: EDF : des coupures d'électricité à prévoir - Jusqu'où iront les syndicalistes ?

    Posté par  . En réponse au journal EDF : des coupures d'électricité à prévoir - Jusqu'où iront les syndicalistes ?. Évalué à 2.

    Ben non ! Génant, oui, dangereux, non, si les gens connaissent le code de la route (comment ça je rêve ?)

    Un feu coupé, c'est prévu, il y a même souvent des panneaux qui sont là _spécialement_ pour le cas où le feu ne marche pas ...

    M'enfin bon, encore faut-il connaître le code de la route (et le respecter) ...
  • [^] # Re: Libr'East of Paris : 3 jours de conférences autour du Logiciel Libre

    Posté par  . En réponse à la dépêche Libr'East of Paris : 3 jours de conférences autour du Logiciel Libre. Évalué à 1.

    Ben alors "est libre" si tu tien absolument à avoir un (mauvais) jeu de mots ...
  • [^] # Re: Algorithme

    Posté par  . En réponse au journal Algorithme. Évalué à 1.

    Solution lente à l'insertion, mais qui devrait être rapide :
    Une table de hashage associant les coordonnées des points (clé) à une liste de régions.

    A noter que si ce qui t'intéresse c'est juste la présence d'une région, tu n'a même pas besoin de faire une liste chaînée, un simple tableau d'identifiant suffit.

    Bon, par contre, il faut faire l'insertion des régions case par case dans la table de hashage, ce qui peut être un peu long ...

    Je ne pense pas qu'il soit possible de faire mieux avec un arbre au niveau de la recherche (a vue de nez, ta vitesse de recherche dans l'arbre dépendra de la profondeur de ce que tu cherche dans l'arbre, donc augmentera avec le nombre de données insérées, alors que la recherche dans une table de hashage se fait en temps constant).
  • [^] # Re: licences en contrat implicite ?

    Posté par  . En réponse au journal licences en contrat implicite ?. Évalué à 2.

    Bon, tout d'abord, une petite précision :
    "En tant qu'étudiant" -> Projets réalisés pendant l'année. (C'est vrai que c'était pas forcément très clair)

    SI c'est un stage alors c'est dans la convention de stage

    Ben oui mais je parlais du cas où ce n'est _pas_ dans le contrat/convention de stage/{autre document contractuel que j'aurais pu oublier}. Chez nous ce n'est pas précisé ;) ...

    Je ne connais pas le fonctionnement des juniors, mais si tu y est rémunéré -> voir mon post précédent, et si c'est spécifié dans le contrat -> idem.

    Pour ce qui est des travaux réalisé dans le cadre des études, tu as normalement signé en début d'année une convention avec ton { école | fac } qui stipule que tous les travaux réalisés appartiennent à l'{école | fac}.

    Encore une fois, je parlait du cas où rien n'est signé dans ce sens ... Sinon effectivement le problème est réglé !

    Ici (fac) il y a déja eut des projets d'étudiants en GPL, diffusés et qui continuent à être développés.

    Ce que j'avais vu, c'est que l'utilisation des ressources de la Fac / Ecole ne donnait normalement pas automatiquement des droits à celle-ci sur ton travail ...

    Ceci dit, c'est un peu un flou juridique normalement, la jurisprudence que j'avais vu (il me semble) était une réalisation faite par des enfants de primaire en classe sous la direction du professeur, le professeur voulait les récupérer (pour je ne sait plus quel usage), le tribunal à estimé que cela appartenait aux enfants, donc qu'il n'avait pas de droits dessus (même en les ayant dirigés pour la réalisation).


    (et après avoir relu la charte informatique signée en début d'année, je confirme, ici rien n'est précisé)
  • [^] # Re: licences en contrat implicite ?

    Posté par  . En réponse au journal licences en contrat implicite ?. Évalué à 4.

    Pour avoir vérifié l'an dernier, c'est soumis au versement d'un salaire :
    Si tu rémunéré par la boite, ton travail lui appartient (sauf contrat spécifique bien sûr)

    Corollaire (que j'avais trouvé, hein, c'est pas moi qui l'invente) : les primes de stage ne sont _pas_ des salaires ... Donc ton travail t'appartient (et vu le nombre de stagiaires payés avec un vrai salaire ;) )

    Corollaire 2 : Des travaux faits en tant qu'étudiant t'appartiennent (même si c'est un peu flou, mais il y a une jurisprudence approchant)

    Maintenant, si quelqu'un à des infos plus précises, etc., n'hésitez pas, je suis pas non plus un spécialiste du sujet ;)
  • [^] # Re: Club-Internet consacre la bêtise !

    Posté par  . En réponse au journal Club-Internet consacre la bêtise !. Évalué à 5.

    > Dans l' absolu, c' est possible, mais à l' heure actuelle je ne connais pas de virus compatible 2000/xp capable de faire ça voila pourquoi il faut douter de cette pub .

    Si, si : Win 2000 et Win XP ...

    (Je connait la sortie --->[])
  • # Re: IDILE participe à Libre en fête à Marne-la-Vallée

    Posté par  . En réponse à la dépêche IDILE participe à Libre en fête à Marne-la-Vallée. Évalué à 2.

    4 choses :
    1/ je n'ai pas vu de lien / news sur le Libre en Fête sur le site ... Le rajouter dans les "projets" et/ou dans la page de présentation ce serait bien ...
    2/ La page "lef2004" n'est pas valide XHTML, c'est mal quand on l'indique sur la page avec lien vers le validateur ;)
    3/ Sur la page du site et l'affiche, vous parlez de Vendredi 15h-17h seulement, alors que dans la dépèche il y a marqué "stand permanent à partir de 11 heures" ?
    4/ Y a t-il besoin d'aide (tenir les stands, etc.) ?
  • [^] # Re: trouver la langue d'un texte

    Posté par  . En réponse au journal trouver la langue d'un texte. Évalué à 4.

    Là j'avais donné des pistes :

    http://linuxfr.org/comments/357202.html(...)

    A priori la technique la plus efficace serait celle avec les 3-grammes ... Mais peut être pas la plus simple à mettre en oeuvre (surtout pour avoir les 3-grammes spécifiques à la langue)

    Enfin, il n'y a pas de technique miracle : tu aura toujours des incertitudes ...

    Ce que je ferais :
    Trouver les ~10 mots les plus utilisés dans chaque texte, et regarder dans un dico de chaque langue s'ils y apparaissent.

    Tu peut affiner en les comparant principalement avec les mots-outils de chaque langue (style les pronoms, déterminants, ...)

    [bref, la loi de Zipf est ton amie]

    Tu peut avoir des outils (GPL) ici :
    http://monge.univ-mlv.fr/~unitex/(...)

    Y compris des dictionnaires sur plusieurs langues ...