Méthode d'analyse des données récupérables sur Twitter

SEO Pour créer, rédiger et optimiser le SEO de vos pages web --> Contactez-nous


Si vous nous faites l'honneur de venir lire de temps en temps ce blog, vous savez que la récupération et l'analyse des données de Twitter sont une de nos marottes (nous avons même développé un super outil pour ça:  Détecter les tendances, les mouvements d'opinion, le futur avec Twitter et Deep Sea ).

Nous menons régulièrement des expériences sur ce qu'on peut récupérer et prédire dans le domaine financier (y a-t-il une corrélation possible entre les cours de bourse et certains phénomènes sur twitter ?  ;-)), politique (sondages, élections et twitter; cherchez quelques cpt-rendus via la catégorie Twitter ), prédictions sportives ou d'audiences tv.

Bien sûr, tout ceci est limité au fait que du jour au lendemain Twitter peut fermer l'accès à ses données (comme le font dès le début Facebook et Google -qui ne montre ses Trends qu'après coup).

L'essor de l'état islamique a mis tout ceci au goût du jour puisque le recrutement, la propagande et donc une grande partie de la guerre menée par Daech utilise et PROFITE des vecteurs internet OCCIDENTAUX avec TWITTER en centre névralgique, puisque Twitter sert d'index (voir Comment Daesh utilise Twitter pourquoi Twitter et les autres réseaux sociaux doivent cesser d'être passifs et Lutter contre l'hypocrisie et l'aide de Facebook, Twitter, Google aux terroristes).

Il existe de remarquables études à ce sujet en anglais et par des anglophones (alors que le sujet peine à intéresser les gens en charge de la lutte en France, sûrement par méconnaissance et faible goût pour Internet) dont http://journals.uic.edu/ojs/index.php/fm/article/view/6372/5194 .

Vous y trouverez des tas d'informations non seulement sur Daech mais aussi sur la façon d'analyser des données.

La méthodologie utilisée par Walid Magdy , Kareem Darwish et Ingmar Weber n'est pas unique à Twitter:

The method presented in this paper sheds light on the antecedents of ISIS support through an analysis of Twitter data. However, our method is in no way ISIS-specific, nor even Twitter-specific. It can be abstracted in the following way:

  1. Identify a research question where it is of interest to understand current and observable differences between groups in the light of not-so-distant events. Example: Given current expressions of support or opposition to ISIS, what are the antecedents of these opinion differences, rooted in past events?
  2. Identify an “always on” source of historical user data relevant to addressing the research questions. Example: Public Twitter data collectable via the REST API.
  3. Determine user groups of interest that differ in their current behavior. Example: ISIS supporters or opponents, identified by how they refer to ISIS.
  4. Choose a feature set that has relevance to the research question and is likely to differentiate between the groups of interest. Example: Counts of terms and hashtags.
  5. Use historical data to train a classifier with the training labels derived from current data. Example: Using a term-based, linear SVM classifier classify current ISIS supporters vs. opponents using their historical tweets.
  6. Perform a feature analysis to understand what differentiates the different groups. Example: Study the highest and lowest weights in the trained SVM model.
  7. Using a mixed methods approach, relate the feature analysis back to the research question. Example: Derive semantic clusters of related hashtags that are linked to past events and use usage differences of these clusters to understand current group differences.

Cette méthode a le mérite d'être rigoureuse et de proposer autre chose que le blabla marketing habituel des outils de surveillance des réseaux sociaux surévalués dont s'auto-célèbrent quelques start-ups dont le seul but est de faire une culbute financière grâce à leurs investisseurs, nombreux millions et 3 clients alibis..


Commentaires sur: Méthode d'analyse des données récupérables sur Twitter

Poster un commentaire sur: Méthode d'analyse des données récupérables sur Twitter







« Enlever le tri et "afficher résultats" sur la page d'accueil d'un WooCommerce (Storefront) | Accueil | Les conseils de Google: résumé des Guidelines - Partie 3: le meetic de la requête et du contenu »


Besoin de contenu, de rédaction web ? Notre proposition sur Redac Web SEO
Besoin d'une info ou d'un développement web, de référencement naturel, de blogs, de Wordpress, de Typepad, de Movable Type ou autres nouvelles "choses web" ? Envie de travailler dans ces domaines ? --> Contactez-nous