Offre de stage Communication
Stage Communication des ONGs de la conservation dans la sphère Twitter :
Analyses des contenus de tweets par apprentissage automatique (machine learning).
Études de cas au Kenya (Parc National d’Amboseli et le Masai Mara National Reserve)
Limite de candidature : 01/03/2022
Mots Clés : Twitter, machine learning, conservation biologique, Kenya, Amboseli, Masai Mara.
Encadrement : François Mialhe (UMR 5600 CNRS – EVS, Lyon) | Yanni Gunnell (UMR 5600 CNRS – EVS, Lyon) | Stéphane Chrétien (ERIC, Lyon)
Cadrage général et objectifs du stage communication
Ce projet de recherche vise à mieux comprendre les diverses politiques de conservation pratiquées au sein de zones à forts enjeux de conservation (i.e. aires protégées et alentours) en analysant les contenus de tweets. Il cherche à mettre en evidence les similitudes et les différences de ces politiques mises en œuvre par les organisations publiques et non gouvernementales. Politique s’entend ici au sens large, incluant notamment les actions, decisions et representations (e.g., via les informations relayés, likées) de ces acteurs.
On part de l’hypothèse que cette communication via les réseaux sociaux révèle les représentations des comptes émetteurs de tweets, en même temps, fabrique et/ou influence les représentations des comptes followers. L’évolution dans le temps des contenus de tweets sera également considérée afin de comprendre les effets joués par des évènements tels que la crise du COVID ou les épisodes passes de sécheresses sur ces organisations. En résumé, ce projet est une analyse critique de la communication web des organisations impliquées dans la conservation de la grande faune dans deux sites Kenyans. Il s’inscrit dans le champ de recherche émergent de la culturomique de la conservation qui étudie les interactions homme-nature à travers l’analyse de corpus numériques (Correia et al. 2021).
Zones d’étude et acteurs
L’écosystème du Grand Amboseli (GAE, qui comprend le parc national d’Amboseli et le parc national de Chyulu Hills) et la réserve nationale de Maasai Mara (MMNR, qui est l’extension nord du parc national du Serengeti) sont des zones historiques phares de la conservation de la faune en Afrique subsaharienne. Ces deux aires protégées et leurs abords sont emblématiques de lieux soumis à des régimes de gouvernance « hybride » (dans le sens de Igoe et Brockington, 2007), c’est-à-dire où les ressources naturelles, les habitats et la faune sont partagés (parfois de manière conflictuelle) entre les éleveurs et agriculteurs masaï, les agences gouvernementales (e.g., Kenya Wildlife Service) et les organisations non gouvernementales (e.g., Big Life, Lion Guardians, etc.). Pour chaque site, une liste d’acteurs impliqués localement dans la conservation a été établie et l’ensemble des tweets émis via leur compte Twitter a été collecté.
Matériel et méthodes
Le corpus de données est constitué de plusieurs milliers de tweets téléchargés grâce à une interface spécifiquement dédiée aux chercheurs.
Le but principal est de classer et d’analyser le contenu de ces milliers de tweets. Les interprétations, seront enrichies par les expériences de terrain menées ces dernières années par plusieurs chercheurs du consortium. Cette phase du travail permettra d’apprécier l’intérêt de combiner l’expérience de terrain avec l’analyse des tweets.
Une première phase du travail consistera à pré-traiter les tweets en supprimant les informations jugées inutiles ou nuisibles : par exemple, les URL, les #s, les mots de liaison, et la tokenisation. Une première étape exploratoire s’appuiera sur la production d’analyses de fréquences des mots et des co-occurrences de mots selon les comptes et en prenant en compte le temps (e.g. avant/après covid).
En plus de cette première analyse exploratoire de contenu, nous chercherons également à étudier les liens qui existent entre les organisations en exploitant les informations d’engagement (retweets, like, follow, mentions) (Correia et al. 2021b). Des réseaux de comptes seront construits en fonction de la « force » des liens, ce qui permettra d’évaluer les alliances, qui pourront ensuite être analysées via les catégories communes du capital social (brinding et bonding social capital).
Nous envisageons également de réaliser une classification non supervisée des organisations basée sur une matrice dont les lignes correspondent aux organisations et les colonnes à une sélection de n-grammes. Les cellules indiqueront la fréquence pondérée des n-grammes (terme fréquence-fréquence inverse du document -tf-idf-pondération) et serviront à élaborer des modèles de machine learning – SVM, Random Forest, etc. (Gaydhani et al. 2018). D’autres methods basées les réseaux profonds (ex. LSTM – Long ShortTerm Memory), et des techniques de dynamic topic modeling seront également testées (Kassab et al. 2020).
Les résultats de ces analyses seront comparées aux classifications des organisations de conservation (basées sur les travaux de Brockington & Schofield, 2010 ; Mace, 2014 ; Diaz et al., 2015).
Profil du candidat
- Niveau Master 2
- Formations cibles : data science, géographie, écologie.
- Connaissances en machine learning
- Programmation : R et/ou Python.
- Une sensibilité aux problématiques environnementales sera appréciée
Conditions d’accueil
Le (la) candidat(e) aura comme structure d’accueil le laboratoire IRG (Institut de Recherche en Géographie) situé sur le Campus Porte de Alpes (Bron). La gratification est alignée sur les bases réglementaires. Ce stage s’inscrit dans un programme de recherche financé par l’ANR, MaGNuM (The Maasai, The Gnu and the Metropolis).
Procédure de recrutement
Date limite de candidature : 01/03/2022
Référence de cette offre de stage cartographie dans le Rhône : OE-171221-2