Où l'on reparle de Twitter comme outil prédictif

SEO Pour créer, rédiger et optimiser le SEO de vos pages web --> Contactez-nous


La justice américaine vient de débloquer 800.000 dollars pour le développement d'un algorithme censé prévoir les violences grâce à l'analyse de Twitter nous apprend Marianne.

Tout est basé sur les travaux de Peter Burnap dont on peut voir un aspect dans Crime sensing with big data: the affordances and limitations of using open source communications to estimate crime patterns (Détection de crimes avec des données massives : les potentialités et les limites de l'utilisation des communications en open source pour déterminer les tendances de la criminalité), publié en mars 2016, et co-rédigée avec Mattew L. Williams et Luke Sloan.

On peut trouver ce document ici: http://bjc.oxfordjournals.org/content/early/2016/03/31/bjc.azw031.full

Et comme les habituelles modes, rien d'est résolu.

1) Twitter représente une toute petite partie des gens (comme l'a récemment montré une étude portant sur la réelle importance de Twitter à propos des programmes de télévision: certes près de la moitié des twittos commentent les programmes tv mais les twittos représentent 5% au maximum des téléspectateurs et ne sont pas représentatifs de leur diversité). On en parlait déjà il y a 2 ans: http://www.tubbydev.com/2014/12/twitter-et-audience-tv-le-gros-pipeau-%C3%A0-vendre-en-2015.html

2) Les algorithmes ont énormément de mal à apprécier le cynisme. Le cynisme est limité sur ceux qui publient POUR Google car ils veulent être bien référencés mais pas sur twitter.

Si à la limite, Twitter peut comprendre le cynisme de l'excellent Kassovitz quand il tweete "on travaille encore bien en France" à propos de ce qui est arrivé à la Nabilla US Kardashian PARCE que derrière il y a des commentaires faisant la morale à Kassovitz, Twitter n'a aucune chance de comprendre le cynisme d'un compte auquel personne ne réagira

3) Les algorithmes de Twitter ont énormément de mal à détecter les mouvements organisés de masse, qu'ils soient organisés par des humains (comme la propagande russe anti ukrainienne) ou par des robots

Alors qu'ets-ce qu'on peut "prédire" avec Twitter ?

- On peut deviner quand certaines choses ne sont pas naturelles, à condition qu'elles aient été "fomentées" par des neuneus bourrins (ou ou actuellement les multiples exemples des moutons lepénistes qui se congratulent ensemble en se retweetant à chaque bulle de leur héroïne).

On utilise pour ça la loi de Zipf et ses semblables qui définissent + ou - le nombre d’occurrences des mots les + utilisés dans un texte "normal" et "naturelle".

- On peut voir quand un phénomène a des RISQUES de partir en vrille. Essentiellement avec 2 métriques:

  • la fréquence des tweets sur le sujet (à condition d'avoir une sorte de track record pour en connaître la moyenne "normale")
  • le nombre de twittos intervenant pour 100 tweets sur un sujet (là aussi il faut un track record) et son évolution dans le temps. Si habituellement, sur un sujet X, 15 personnes sont les auteurs de 100 tweets, passer à 80 personnes ou à 2 montre qu'il se passe quelque chose

Ces 2 métriques doivent être évaluées:

  • pour tous les tweets
  • pour les tweets - les retweets
  • pour les tweets - les tweets à url
  • pour les tweets - les tweets à images

Pour analyser précisément ces phénomènes, il est bon aussi de pondérer en fonction du temps qu'il faut (Hé ben oui, le VRAI temps compte) et le jour de la semaine.

Bien entendu, la localisation des comptes, quand elle est connue, joue aussi son rôle.

On peut aussi s'amuser à mesurer ceci en écrétant les tweetos pris en compte (donc en enlevant ceux qui sont nés il n'y a pas longtemps et les + vieux et/ou ceux qui ont le + de followers et ceux qui en ont le moins).

MAIS, quoi qu'il en soit, on peut très bien avoir un phénomène qui se déclenche SANS que ces métriques aient changé.

Et bien entendu, il reste toujours le problème de savoir si les faits qui causent réellement le phénomène ont eu lieu AVANT la manifestation sur twitter ou après.

Par exemple, en 2012, nous avions suivi les comptes twitter de Morano, NKM, Princen, Besson () mais rien trouvé de vraiment intéressant à part une corrélation entre l'humeur de Morano sur twitter et les sondages sur sarkozy MAIS qui dit que Morano, quand elle tweetait, ne savait déjà pas QUEL sondage sortirait le lendemain ??

Bref, la prédiction avec twitter, ce n'est pas gagné mais tant que certains arrivent à vendre ça, dans le joli emballage Big Data.. 

Comme disent les agents immobiliers: chaque matin se lève un pigeon :-))

 

Commentaires sur: Où l'on reparle de Twitter comme outil prédictif

Poster un commentaire sur: Où l'on reparle de Twitter comme outil prédictif







« Le vrai business du SEO en France | Accueil | Christian Estrosi et la mairie de Nice sont-ils à la tête d'un empire web ? »


Développement it et web, rédaction contenu web,  SEO, scrapping, growth hacking

Besoin de SEO, de développement, de rédaction de contenu web ? Besoin d'un blog, de Wordpress, de Prestashop ou autres nouvelles "choses web" ? Envie de travailler dans ces domaines ? --> Contactez-nous