Marketing

Google comprend assez bien un style d’auteur pour l’imiter

Si vous souhaitez un coaching marketing je vous invite à consulter les différents services proposés.

Plus tôt cette année, j’ai écrit un article intitulé Author Vectors: Google Knows Who Wrote Which Articles qui portait sur un brevet de Google qui nous parlait de la capacité potentielle de Google à identifier qui pourrait être l’auteur de contenu sur le Web.

Google analyse le contenu des auteurs depuis un certain temps, ce qui peut être vu dans la visionneuse Google Books N-gram Viewer Il existe de nombreuses fonctionnalités que vous pouvez utiliser pour explorer le corpus Livres des nombreux livres que Google a numérisés, et vous pouvez Découvrez les fonctionnalités de recherche de la visionneuse N-gram de Google Livres. Google a soigneusement indexé le contenu de tous les livres du projet.

Ce brevet m’a amené à me demander quel pourrait être le statut du projet de numérisation de livres Google. J’ai trouvé un article avec un titre qui demandait quelque chose de similaire: Qu’est-il arrivé à l’effort de Google pour numériser des millions de livres de bibliothèques universitaires? Il semble qu’il existe d’autres projets en plus de la visionneuse N-gram où les informations du projet Google Livres sont utilisées.

Le brevet Author Vectors dont j’ai parlé montre que Google a beaucoup appris sur les auteurs sur le Web et peut-être dans le projet Google Books. J’ai cherché les auteurs du brevet de vecteurs d’auteur pour voir ce qu’ils avaient écrit d’autre et j’ai remarqué que Brian Strope était l’inventeur d’un autre brevet sur les auteurs. Cet autre brevet montrait ce qu’ils pouvaient savoir sur les autres auteurs et ce qu’ils pouvaient faire des informations sur les auteurs. Le brevet sur les vecteurs d’auteur était censé aider à identifier les auteurs du contenu et à faciliter les recherches de contenu par ces auteurs. Ce nouveau brevet montre la confiance dans la façon dont ils comprennent comment des auteurs spécifiques pourraient écrire.

Je tiens également à souligner un article sur lequel j’ai collaboré avec Lily Ray à propos de EAT, dans lequel nous avons discuté de la façon dont Google pourrait apprendre à comprendre qui sont les auteurs du contenu qu’ils pourraient trouver sur le Web, même en l’absence de lignes d’auteur pour cela. contenu. Cet article s’intitule The Mechanics of EAT: Comment les brevets Google peuvent aider à expliquer le fonctionnement d’EAT

Que couvre ce brevet d’auteur?

Imaginez que vous aimeriez transformer quelque chose que vous aviez écrit dans le style d’un autre auteur comme William Shakespeare ou Ernest Hemingway ou Stephen King?

Ce brevet décrit être sur le point de faire exactement cela.

Il pourrait transformer et classer le texte en fonction de l’analyse des textes de formation d’auteurs particuliers. Et Google a accès à de nombreuses données de formation provenant de plus de 25 millions de livres, avec les nombreux livres numérisés du projet Google Livres. Et il y a de nombreux auteurs sur le Web que Google pourrait également étudier.

Le brevet pourrait fonctionner avec des applications de création de texte telles que

  • Traitement de texte
  • Clients de messagerie
  • Navigateurs Web
  • Autres applications

Ces applications acceptent le texte des utilisateurs disposant de claviers ou d’autres périphériques d’entrée.

Certaines de ces applications peuvent analyser le texte d’entrée pour identifier les erreurs courantes concernant l’orthographe, la grammaire ou la mise en forme.

Ce brevet couvre les technologies qui peuvent être utilisées pour réécrire le texte dans un style linguistique demandé.

Avantages à suivre le processus décrit dans le brevet

En permettant à quelqu’un de transformer le texte d’entrée dans le style d’un auteur particulier, le texte d’entrée peut être modifié pour utiliser des mots et des phrases communs pour un type d’écriture particulier associé à l’auteur cible, ce qui peut rendre le texte plus probable être compris par un public qui attend ce type d’écriture.

2. Le texte d’entrée peut être transformé en un style attendu par le public pour le texte, ce qui rend plus probable que le texte sera bien reçu par le public. Le texte d’entrée pourrait être transformé en un style utilisé par un destinataire prévu d’un courrier électronique contenant le texte d’entrée basé sur des messages électroniques précédemment envoyés par le destinataire prévu.

3. L’auteur d’un texte d’entrée peut être en mesure d’améliorer la qualité du texte d’entrée en le transformant dans le style d’un auteur respecté, par exemple dans le cas d’un auteur de texte d’entrée qui n’est pas un locuteur natif de la langue de le texte d’entrée.

Le brevet sur la transformation du texte en différents styles d’auteur est:

Classification et transformation du texte en fonction de l’auteur
Inventeurs: Brian Patrick Strope et Matthew Steedman Henderson
Cessionnaire: Google LLC
Brevet américain: 10,083,157
Accordé: 25 septembre 2018
Déposé le 5 août 2016

Abstrait

L’invention concerne des procédés, des systèmes et un appareil, y compris des programmes informatiques codés sur un support de stockage informatique, pour transformer et classer un texte sur la base d’une analyse de textes d’apprentissage d’auteurs particuliers. L’un des procédés comprend la réception d’un texte d’entrée comprenant un ou plusieurs mots et un auteur demandé; générer un flux vectoriel représentant le texte d’entrée basé sur un modèle de langage de codeur et comprenant un ou plusieurs vecteurs multidimensionnels associés aux mots associés du texte d’entrée et représentant une distribution de contextes dans lesquels les mots associés sont apparus dans une pluralité de textes d’apprentissage; et produire un texte de sortie représentant une transformation particulière du texte d’entrée basé au moins en partie sur un modèle de langage de décodeur, le flux vectoriel généré et l’auteur demandé.

Transformer du texte en Shakespeare

Ce brevet porte sur des techniques utilisant des modèles de langage qui ont été formés avec du texte de différents auteurs pour réécrire le texte.

A titre d’exemple, le texte fourni par un utilisateur peut être transformé en texte de sortie dans le style d’un auteur particulier demandé par l’utilisateur.

Cette transformation pourrait être effectuée à l’aide de modèles de langage qui ont précédemment analysé des textes écrits par l’auteur particulier qui modélisent les mots que l’auteur a utilisés dans le contexte de ces textes.
Les modèles de langage pourraient prédire les mots les plus probables que l’auteur sélectionné utiliserait dans le contexte du texte d’entrée et produiraient un texte de sortie reflétant ces prédictions.

Le texte de sortie est considéré comme une transformation du texte d’entrée dans le style linguistique de l’auteur particulier.

Par exemple, si vous receviez un texte d’entrée de «quelle est cette lumière dans la fenêtre» et un auteur demandé de «William Shakespeare», le texte d’entrée pourrait être transformé en texte de sortie représentant la manière dont William Shakespeare aurait écrit le texte d’entrée basé sur des modèles de langage issus de l’analyse de son travail.

Le texte d’entrée de «quelle est cette lumière dans la fenêtre» pourrait être transformé en «quelle lumière à travers cette fenêtre se brise».

Transformer le texte de Shakespeare

Le brevet fournit un autre exemple, montrant la transformation opposée (par exemple, de «quelle lumière à travers cette fenêtre brise» à «quelle est cette lumière dans la fenêtre») pourrait être effectuée.

Une telle transformation peut être effectuée en utilisant le texte de William Shakespeare comme texte d’entrée (avec Shakespeare identifié comme l’auteur du texte d’entrée) et en spécifiant la personne demandant la transformation en tant qu’auteur demandé.

Le texte serait transformé dans le style de la personne demandant la transformation sur la base du texte préalablement analysé et modélisé écrit par la personne (par exemple, e-mails, articles, etc.).

Autres transformations de style d’auteur

Par exemple, quelqu’un peut demander que le texte d’entrée soit transformé en un style d’auteur commun à un groupe particulier d’auteurs. Cela pourrait être basé sur:

  • Texte produit par les employés d’une entreprise particulière
  • Texte d’auteurs écrivant dans un domaine particulier
  • Texte d’auteurs publié dans une revue particulière
  • Ou d’autres groupes

En plus d’utiliser des modèles de langage qui ont été formés avec du texte de différents auteurs, il existe d’autres résultats potentiels.

Le texte d’entrée utilisant un style d’auteur particulier peut être classé comme «satire» ou «non satirique».

Ou le texte d’entrée pourrait être classé en fonction de l’auteur le plus susceptible d’avoir écrit le texte d’entrée.

À emporter sur le style d’auteur

transformation du style d'auteur

Ce brevet fournit plus de détails sur la façon dont les modèles de langage peuvent être créés à partir de contenu créé par d’autres auteurs en utilisant certaines des approches de traitement du langage naturel développées par Google. J’ai partagé ce brevet parce que je voulais montrer à quel point Google est devenu à l’aise avec l’idée qu’ils pourraient efficacement transformer du contenu en contenu qui utilise le style d’auteur d’un auteur sélectionné, ou du contenu qui semble avoir été écrit par quelqu’un d’une entreprise spécifique ou qui travaille dans un domaine spécifique, ou qui écrit pour un journal pour une discipline spécifique. La capacité de Google à utiliser des modèles de langage qui peuvent émuler des auteurs ou des auteurs spécifiques de niches ou d’industries spécifiques ou avec un certain niveau d’expertise nous indique leur facilité à créer des modèles de langage basés sur le contenu de formation.

Je me demande comment Google pourrait classer le contenu que j’écris ou le contenu que d’autres que je connais écrivent. Ils semblent bien comprendre les auteurs maintenant.

Source link

Leave a comment

Your email address will not be published. Required fields are marked *