Content spinning

Réécriture de contenu automatique

Générateur de content spinning en php mysql

J’utilise beaucoup de « content spinning » pour publier du contenu sans duplicate content sur mes sites et je m’en sert également pour faire des descriptions unique de partout ou je laisse mes liens. Depuis que j’ai découvert le content spinning sur discodog et que depuis j’en fais presque tous les jours, je me dis de plus en plus que l’on peux automatiser cela un minimum. J’ai donc commencé à partager avec plusieurs personnes à ce sujet et après un peu de codage (et de copier coller faut bien l’avouer) j’ai réussi à creer en php/mysql « Texte Generator V1″ que je partage sur ce site pour le faire évoluer.

Je ne partage plus le code source publiquement pour éviter que n’importe qui en fasse n’importe quoi… contactez moi si vous souhaitez contribuer à l’évolution du code source. Si vous avez pu le télécharger avant merci de ne pas le publier. Les bons plans doivent rester en petit comité (surtout quand ils évoluent dans le bon sens). L’outil reste et restera disponible et utilisable gratuitement ici : Content spinning automatique

Si vous avez des questions, des suggestions ou des modifications à proposer, les commentaires sont fait pour ça ;)

30 réponses à to “Générateur de content spinning en php mysql”

  • Didier:

    Bonjour,

    Joli travail mais où trouve-t-on la BDD de synonymes ?

  • Bonjour didier,

    si je partage ce script c’est justement pour trouver du monde que ca intéresse pour que l’on crée ensemble la base de donnée…

  • Il y a deja celle d’open office, qu’on peut trouvé sur seoblackout il me semble ;)

  • Bonjour morgan,

    tu la trouve bien la base d’open office pour faire des textes compréhensible ?

    perso j’ai vu trop de synonyme foireux et faire du bon content spinning avec simplement des mots synonymes j’y crois pas trop…

    Les mots ont un sens différents suivant les autres qui les entoures et c’est pour cela que je propose de faire une base d’expression et non pas de mot synonyme.

  • Salut,
    Je me suis basé sur ton script et j’ai fait un script de spinning recursif (je ne me suis interessé qu’au spinning), je l’ai posté sur mon blog, je t’ai fait un petit BL sympa bien entendu ;)

  • Salut 512banque,

    je t’ai répondu sur le forum discodog ;)

    par contre j’ai oublié de te demander si je peux intégrer ta fonction au script ca fera déjà un peu plus propre…

    Et à la base je partage le script pour que justement on l’améliore.

  • Bien sûr que tu peux intégrer la fonction au script, ya intérêt même ;)

  • Didier:

    OK pour travailler ensemble sur une base de données synonymes, mais comment qu’on fait ? ;)

  • Canyon:

    Salut les filles. Excellent les scripts de spining, c’est la mode en moment, ou quoi …?

    Bonne continuation, la famille. ++

  • @512 merci je vais faire ca dans la semaine et rendre le code plus propre car je ne cache pas que j’ai honte un peu d’avoir publié ca comme ca :D

    @didier il manque encore quelque intéressé et je met en ligne une version white et une version black que l’on pourra commencer à utiliser.

    @Canyon bienvenue et oui j’espère que ca intéresse du monde et qu’on pourra en faire un bon tool car le potentiel est vraiment énorme.

  • salut,
    moi je n’ai pas le même avis que vous automatisé le spinning je croix que c casi impossible il vous faudra une base de données en centaines de gigas et je ne croix pas que sa sera suffisant. je pense que le spinning manuelle c’est encore et restera la solution unique pour faire du texte unique..
    en tous cas bon courage et je suis disponible pour donner un coup de main..

  • Salut ringout,

    « impossible is nothing » ;) si faut des gigas ou des terras de base mysql ya pas de souci, je suis prêt à investir dans ce projet.

    Biensur que tout ce qui ce fait manuel est souvent de meilleur qualité que ce qui est fait automatiquement, mais essayons de se rapprocher le plus possible du manuel…

    Le coté automatique est fait pour gagné du temps mais rien ne nous empêche de faire des retouches manuellement derrière si la qualité ne nous convient pas.

    Avec ce projet je ne prétend pas pouvoir « spinner » à 100% mais si on peux enregistrer en mysql les expressions qui ressorte le plus souvent c’est déjà ca de gagné ;)

  • Didier:

    {c’est clair|Tout à fait|+1|Je partage ton avis}{| Nicolaseo} ;)

  • je viens d’installer un plugin pour gérer un espace membre sur ce site

    si le projet vous intéresse vous pouvez vous inscrire ici : http://www.content-spinning.com/inscription

  • @Morgan, @Nicolaseo, @Ringout:

    La base de synonymes d’Open Office est intéressante. Mais il faut l’utiliser à bon escient afin de choisir le bon sens des mots pour proposer des synonymes ad’hoc.

    C’est une bonne idée Nicolaseo de proposer une base d’expression ;)

    Ringout, en couplant c’est 2 méthodes (en semi-automatique) on obtient un résultat, certes pas aussi excellent que le tout manuel, mais du’un rapport qualité / cout de bonne qualité. Et pas besoin de centaines de gigas !

    Pour Info, je travaille aussi sur ce sujet ;) et avec une base de l’ordre de 5 méga (synonymes + thésaurus) j’obtiens des résultats fort intéressant. (rem: je ne sauvegarde pas les expressions saisies).

  • enemme:

    il vous suffit de parser un petit site qui est un dictionnaire des synonymes http://www.crisco.unicaen.fr/ par exemple, vous tapez un mot et ressort un ensemble de mots synonymes. Il vous suffit de parser la valeur width de la barre (16,24,35,45,54) pour avoir un dictionnaire pondéré par expressions…..c’est pas très dur…brefff, je suis pas développeur, je sais juste que c’est possible….

  • Bienvenue lemoussel et enemme,

    @lemoussel tu dis « Mais il faut l’utiliser à bon escient afin de choisir le bon sens des mots » donc si tu le fais avec des mots je serais curieux de voir comment tu t’y prend et comme tu dis pas besoin de giga…

    @enemme merci pour le lien (pour ceux qui connaissent pas) mais je reste persuadé qu’une base « d’expression synonyme » fera du texte de meilleur qualité. (cf:http://www.crisco.unicaen.fr/cgi-bin/trouvebis2?requete=boutique&refer=%23&proc=2214_29116… je me vois mal faire « votre {boutique|magazin|bazar|affaire|boîte|clan|coterie|commerce|clique|baraque|debit} »)

  • kneoh:

    Nicolaseo,

    Je suis partant pour aider à la mise en place de la base de données vu que c’est plus qu’un simple dictionaire.

    Bien à toi,

    Rv.

  • Bienvenue Kneoh,

    Avant de mettre en place les scripts pour que l’on commence à remplir les base de donnée j’aurais aimé votre avis sur le script:

    Comporte t’il des trou de sécurité si oui lesquels ?
    Avez vous des suggestions d’amélioration ?

  • Bonjour à tous
    Excellente idée de spinner les expressions plutot que les mots.
    Avec les expressions on suprime presque totalement le risque de phrases incomprehensibles.
    Dans « Magic Article Rewriter » l’option magictokens a
    535 expressions de 4 mots ou plus
    2799 expressions de 3 mots ou plus
    10500 expressions de 2 mots ou plus

    Savez vous par où commencer pour choisir les expressions à spinner?

  • Bonjour,
    une autre chose qui n’as pas encore été mentionné dans les discussions, plus vous mettez des expressions (Nombre de mots importants) plus vous augmentez les possibilité d’être pénalisé duplicate content. moi je croix qu’il faudra minimisé les chaines de mots, en utilisant au maximum 2 mots pour que sa passe plus facilement les filtres de google. j’ai mis quelques outils pour sélectionner seulement les textes qui ont un % de similarité bas http://ringoutseo.blogspot.com/2010/01/ameliorer-vos-textes-spinner.html
    a+

  • Kneoh:

    Bonjour à tous,

    Je suis partisan de la construction progressive de la base.

    @Caribou
    Je pense qu’il serait bon de construire par rapport à des expressions cependant, il peut arriver qu’une expression contienne un mot qui a été mis formalisé en tant que principal dans un autre contexte.

    Voici quelques éléments par rapport à mes premiers test:

    1. La récursivité ne marche pas si l’id de « le word spinner » est supérieur aux id « le word » et « spinner ». Dans ce cas, le script propose directement les résultats du hachage de l’expression et vous pourriez perdre l’expression principale et le sens original. Mon idée est de classer le résultat de la première requète par la longueur de l’expression de la colonne « synonymes_racine ».

    2. l’expression « le word spinner » va pouvoir donner ces synonymes mais il n’y aura pas de récursivité si vous avez placé ‘word’ et ’spinner’ en tant que mots principaux sauf si vous avez mis en place « le word spinner » comme synonyme de lui-même i.e. le word spinner : { le word spinner | le synonyme 1 | le synonyme 2 } => { le { {word1 | word2 } } { {spinner1 | spinner2} } | le synonyme 1 | le synonyme 2 }.
    A chacun de voir s’il leur convient d’offrir la possibilité que le mot principal soit synonyme de lui-même.

    3. Il serait bon de mettre en place une option qui sauvegarde dans un fichier txt/xls/… plusieurs version de texte généré. Qui pourront ensuite être comparé.
    @ringout
    Merci pour les outils

    4. J’ai mis en place une petite vérification pour s’assurer de l’unicité des mots principaux. Ainsi, si quelqu’un veut rajouter dans la DB un synonyme pour un mot principal déjà existant, qu’il en soit informé et qu’il le rajoute si cela est sa volonté.
    Je ne sais pas s’il faudrait donner plus de possibilité de ce genre comme par exemple pouvoir modifier directement un mot principal et ses synonymes.

    5. En terme de trous de sécurités, je dirai de mettre en place une distinction entre code et affichage, ainsi qu’importer les infos de la DB et éviter que l’on puisse faire passer un script dans les formulaire… du classique de PHP en somme.

  • Sympathique idée, je voudrais bien vous filer un coup de pouce, mais je n’ai pas de connaissance en PHP … alors je vais me contenter de suivre, merci.

  • Didier:

    Coucou c’est Didier, pourrais-tu me communiquer le MDP du dernier billet afin que j’apporte ma pierre à l’édifice ? (par e-mail ça roule ^^)

  • Salut, didier, pour le moment il n’y en a pas car j’ai pas trouvé comment faire pour que ca prenne en compte le script donc il est utilisable sans.

    Vous pouvez vous faire la main dessus car de toute facon elle sera remis a zero (biensur avec un backup des bonnes expressions ajouté).

    A l’heure actuel jattend toujours que les 2 personnes me re contact (et a mon avis je peux toujours attendre) pour m’aider à faire l’espace membre et le système de modération donc je vous laisse mon email « seowllc at gmail com » et mon msn « odb63 at hotmail fr » si ca vous tente de m’aider a coder ca.

  • Finalement je viens de réussir à intégré sous l’espace membre (le script s’affiche uniquement si vous êtes connecté) reste à voir pour la gestion des modos…

  • Juste pour vous informer que j’ai fais une nouvelle mise a jour ;)

    J’ai surtout modifié l’interface afin que ce soit plus clair et simple à utiliser.

    Si vous avez des suggestions d’amélioration j’essayerais d’ajouter à la prochaine mise a jour ;)

  • Je viens d’ajouter une petite fonction en ajax pour l’ajout des expressions qui permet verifier en direct si les expressions sont déjà présentent ou pas dans la base.

    De nombreux mots et expressions dans le domaine du X ont également été ajouté dans la base.

  • renardchenapan:

    Bonjour NicolaSeo,
    Je t’avoue etre très interessé par ton projet, en effet je dois réaliser dans
    le cadre de mon stage un analyseur syntaxique, et après plusieurs recherches il
    m’est apparu qu’un dictionnaire d’expression est une condition sine qua non pour
    que le texte final ait du sens.. Comme c’est mon sujet de stage, je vais m’y
    consacrer pendant un petit moment et je trouve que ton projet est un excellent
    début, même s’il reste des choses perfectibles (comme toujours)
    Cdt

  • Salut
    Pourras-tu me basculer en membre de confiance afin que je puisse rajouter des
    expressions à la base ainsi que regarder comment tourne le script et si je peu y
    améliorer des choses..
    Je pense également qu’il vaut mieux avoir des champs spécifiques (général,
    adulte, etc..) pour éviter d’avoir par ex « la {femme|chiennasse} du 1er ministre
    .. » xD.
    Cdt

Laisser un commentaire

Newsletter


Membres

228 Usagers - Tout afficher









Créé avec Small Mingle Icon Mingle

Connexion

Vous devez être connecté pour participer au projet.


La liste des participants

Vous voulez que ce projet évolue plus rapidement mais vous ne savez pas coder et vous n'avez pas de temps pour ajouter des expressions synonyme ?
Vous pouvez faire un don du montant de votre choix, l'argent ainsi récolté permettra d'engager des dévellopeurs ainsi que de faire remplir la base de donnée par des rédacteurs professionels.