Archives par mot-clé : Audio

Avis de parution « L’outil et la méthode… », 143 (1), BMS, juillet 2019

J’ai l’honneur et le plaisir de vous annoncer la parution du numéro que j’ai coordonné sur les usages des CAQDAS dans le n° 143 du Bulletin de méthodologie sociologique (BMS).

L’outil et la méthode. Des fonctionnalités techniques des CAQDAS à leurs usages méthodologiques

Entre l’outil et la méthode, entre le tutoriel et le manuel de méthodes, se trouve comme une case manquante : l’étude des usages concrets que les chercheur.e.s font des logiciels d’aide à l’analyse qualitative (CAQDAS). Les contributions réunies dans ce numéro proposent d’ouvrir cette boı̂te noire de l’analyse en revenant sur différents usages de ces outils dans le cadre d’enquêtes sur des objets aussi variés que la médecine légale, la dimension sexuée du traitement pénal, le comportement politique des électeurs états-unien, la place des intellectuels dans les partis ou l’impact de la crise et de l’européanisation sur les régions sociales-démocrates. Plutôt qu’une présentation des fonctionnalités offertes par ces logiciels, il s’agira de saisir les stratégies de codage déployées par les auteur.e.s et les traditions d’analyse dans lesquelles ils/elles s’inscrivent mais aussi les effets de ce type de logiciels sur les pratiques de recherche.


Sommaire du dossier

Thibaut Rioufreyt: « Introduction », pp. 7-27.

Luis Antonio Vila-Henninger, « Turning Talk into “Rationales”: Using the Extended Case Method for the Coding and Analysis of Semi-Structured Interview Data in ATLAS.ti », pp. 28-52.

Kathia Barbier & Romain Juston, « Équiper le processus de recherche. Retours réflexifs comparés sur l’usage d’Atlas.ti et de Sonal dans deux recherches doctorales », pp. 53-76.

Thibaut Rioufreyt, « Réanalyser des enquêtes qualitatives à l’aide de CAQDAS », pp. 77-106.


Vous trouverez plus de détails sur l’ensemble du n° 143 sur le site de l’éditeur de la revue, Sage (ici). L’accès à l’article en ligne sur ce site est payant. Toutefois il est gratuit via le SAGE Humanities and Social sciences package 2018 lequel est disponible notamment pour tous les membres de laboratoires CNRS.

 

Journée de réflexion Éthique de la recherche, Genève, UNIGE, 26 février 2019

Ma dernière intervention a eu lieu dans le cadre de « Journée de réflexion 2019 : l’éthique (en) pratique. Enjeux éthiques autour de la production et la gestion des données en sciences sociales » organisée par par la commission d’éthique de la recherche de la Faculté des sciences de la société. À l’invitation de celle-ci, j’ai fait une conférence introductive à cette journée dont voici la présentation :

Les enjeux éthiques du « tournant numérique » des sciences sociales. Critiquer et s’approprier les outils pour la production et la gestion des données

La révolution numérique impacte désormais les sciences sociales sous de multiples aspects. Elle ouvre à l’investigation de nouveaux terrains (réseaux socio-numériques, forums et groupes de discussion web, Fab-Lab…) et objets d’étude (makers, cyberhacktivistes, participation politique online, etc.). Elle offre dans le même temps l’accès à de nouveaux types de « données » (corpus web) dans des volumes inédits (Big Data). Elle a également des effets sur les sciences sociales à travers l’émergence de nouveaux outils et/ou méthodes d’analyse (data mining, analyse de réseaux, cartographie, modélisation de systèmes complexes, simulation, etc.). Certains auteurs diagnostiquent ou appellent de leurs vœux l’émergence de sciences sociales numériques. Toutefois, la littérature sur le sujet tend souvent à minimiser, voire ignorer, un autre aspect du tournant numérique des sciences sociales, beaucoup plus basique et terre-à-terre et pourtant fondamental. Un aspect qui concerne l’ensemble des chercheur.e.s, qu’ils travaillent ou non sur les corpus web ou les Big Data, qu’ils se revendiquent ou non des Digital Social Sciences ou des Humanités numériques, qu’ils soient qualitativistes ou quantitativistes. Il s’agit des outils de base que chacun.e de nous utilise pour la production et la gestion des données : dictaphones numériques ou smartphones utilisés pour enregistrer des entretiens ou des séances d’observation, logiciels de bureautique, bases de données, espaces de stockage en ligne comme Dropbox ou Google Drive où l’on met ses données, messageries comme Gmail ou Outlook par lesquelles on envoie des messages à nos enquêtés, aux membres de l’équipe de recherche, repositories où l’on dépose nos enquêtes en vue de leur partage et/ou de leur archivage, etc. Or, l’utilisation de ces outils – conçus pour l’essentiel par des entreprises privées, dont les GAFAM – soulève toute une série de questions concernant à la fois la protection des données personnelles, la pérennité des données de la recherche, le partage des productions scientifiques et l’autonomie de la science. Cette communication se propose plus particulièrement d’analyser les enjeux et défis éthiques (et politiques) soulevés par l’utilisation de ces outils à chaque étape de la vie des documents d’enquête, depuis leur production jusqu’à leur partage en passant par leur traitement numérique et l’élaboration du plan de gestion des données.


Le diaporama de présentation est disponible sur le site de la Faculté des sciences de la société de l’Université de Genève ici : https://www.unige.ch/sciences-societe/files/4615/5290/1038/Diaporama_Unige_Rioufreyt_CCBYNCND.pdf

Vous pouvez également écouter sur ce même site l’enregistrement audio de cette conférence ainsi que de celle de Pablo Diaz (Chargé de recherche, Fondation suisse pour la recherche en sciences sociales, Université de Lausanne) sur l’éthique à l’ère de l’open research data qui a eu lieu juste après, ici : https://www.unige.ch/sciences-societe/faculte/organisation/commissions-de-la-faculte/commission-dethique/journee-de-reflexion-2019-lethique-en-pratique/

Ces deux conférences ont été suivies d’ateliers de présentation de quatre communications qui traitent d’un ou plusieurs aspects des questions éthiques et déontologique dans la recherche.

Webinar Tuto@Mate sur les logiciels de transcription, 3 juillet 2018, 14h-16h30

Thibaut Rioufreyt est Post-doctorant en science politique, Centre de science politique et de politique comparée (CESPOL), Université catholique de Louvain (UCL).

La transcription des matériaux d’enquête (entretiens, focus groups, enregistrements d’observations…) est une activité centrale de la recherche qualitative. Les publications et manuels sur la manière de transcrire sont désormais fort nombreux. Cependant, la plupart néglige encore largement l’usage de logiciels pour ce faire ou se restreignent à quelques-uns d’entre eux. Dans cette perspective, ce webinar se propose d’esquisser un panorama des différents logiciels à la disposition du/de la transcripteur/trice. L’objectif de ce webinar est double. Il s’agit d’une part de proposer une synthèse des principaux outils existants et des caractéristiques techniques principales de chacun d’entre eux. 24 logiciels seront ainsi abordés. Le premier objectif de ce webinar est ainsi d’aider à s’y retrouver face à une offre pléthorique en la matière. D’autre part, ce webinar propose neuf critères simples permettant de choisir le logiciel le plus adapté aux besoins de sa recherche, à ses compétences et à son corpus. Entre le manuel de méthodes généraliste et le tutoriel d’utilisation de tel ou tel outil, il existe encore trop souvent une sorte de ressource intermédiaire manquante. Ce webinar se veut précisément une contribution pour répondre à ce manque ressenti par nombre de collègues ingénieurs et chercheurs.


Les précisions techniques pour se connecter au webinar seront communiquées sur le site du réseau MATE-SHS.


Vidéo disponibles en téléchargement :

Sonal par Alex Alber (juin 2016)

Atlas-ti et NVivo, 2 exemples de CAQDAS par Annie-Claude Salomon et Stéphanie Abrial (mars 2017)

L@ME : un logiciel libre d’analyse et de traitement de messages électroniques par son développeur, Frédéric Vergnaud (juin 2017)

Analyse des questions ouvertes d’un questionnaire par Bénédicte Garnier et France Guérin-Pace (octobre 2017)

MAGRIT, logiciel libre de cartographie accessible via un navigateur web, par Mathieu Viry (novembre 2017)

GEPHI par Paul Gourdon (janvier 2018)

LimeSurvey par Claudie Beaubineau (mars 2018)

Cartography par Timothée Giraud (avril 2018)

Bientôt en ligne ! Scrapy par Jean-Baptiste Pressac (mai 2018)

Contacts

Benoit Tudoux : benoit.tudoux@univ-tlse2.fr / Viviane Le Hay :  v.le.hay@sciencespobordeaux.fr

 

 

Fiche méthodologique n° 2: La transcription outillée en sciences sociales

Dans la précédente fiche méthodologique (n° 1), il s’agissait de donner à voir les enjeux, conseils et manières de faire concernant la transcription d’entretiens en sciences sociales. J’avais alors abordé dans une première partie les outils – logiciels et matériels – à la disposition du transcripteur pour lui faciliter le travail et réduire le temps consacré par entretien: logiciels de traitement de texte (Libre Office) et de lecture audio, pédaliers de transcription, logiciels de transcription (comme Sonal ou Transcriber), logiciels de reconnaissance vocale (Dragon, Express Scribe, Vocals) ou encore dispositions de clavier alternatives comme Dvorak ou Bépo.

Cette seconde fiche méthodologique est destinée à aller plus loin dans cette voie en se concentrant sur les logiciels de transcription audio/vidéo. Dans cette perspective, vient de paraître un article sur ce sujet dans le Bulletin of Sociological Methodology/Bulletin de Méthodologie Sociologique. La version online est d’ores et déjà disponible. La version papier sortira au sein du n° 139 en juillet 2018.

Thibaut Rioufreyt, « La transcription outillée en SHS. Un panorama des logiciels de transcription audio/vidéo« , Bulletin of Sociological Methodology/Bulletin de Méthodologie Sociologique, n° 139, Article first published online: April 24, 2018, https://doi.org/10.1177/0759106318762455.

Cet article propose d’esquisser un panorama des principaux logiciels à la disposition du transcripteur permettant de lui faciliter le travail et de garantir la qualité des transcriptions. L’objectif visé est double. Il s’agit d’une part de mettre à disposition une synthèse des outils existants (24 logiciels sont traités) et des caractéristiques techniques principales de chacun d’entre eux. Il existe en effet une offre pléthorique en la matière, au point qu’il est difficile de s’y retrouver pour l’utilisateur lambda. D’autre part, cet article ne propose pas simplement une liste d’outils mais neuf critères simples permettant de choisir le logiciel le plus adapté aux besoins de sa recherche, à son corpus et à ses compétences : rôle de la problématique et de l’objet de recherche, spécificité du terrain, plate-forme sur laquelle fonctionne l’outil, disponibilité du logiciel, mode de représentation des données, articulation des supports, format des données, outils de lecture et de traitement du son, fonctions d’analyse proposées par ces logiciels.


L’accès à l’article en ligne sur le site de l’éditeur (Sage) est payant. Toutefois il est gratuit via le SAGE Humanities and Social sciences package 2017 lequel est disponible notamment pour tous les membres de laboratoires CNRS. Par ailleurs, une version preprint gratuite devrait bientôt être mise à disposition.

 

Webinar Mate-SHS: « Alex Alber présente le logiciel SONAL », 6 juin 2016

Le réseau MATE-SHS1 organise un webinar2 lundi 6 juin 2016 de 15h30 à 17h. Alex Alber, Maître de conférences en sociologie à l’Université de Tours et chercheur au laboratoire CITERES, présentera à cette occasion le logiciel SONAL qu’il a développé et qui permet de transcrire, organiser et analyser des données issus d’entretiens. Sonal est un logiciel gratuit (malheureusement pas (encore) open source) qui travaille directement sur les fichiers sons, avec le principe d’un surligneur sur la bande sonore. Après sélection, l’utilisateur peut retranscrire et colorer par thématiques différentes parties de l’entretien. L’ensemble du corpus d’entretiens est ensuite compilé pour aboutir à un « mur d’extraits » qui offre une vision d’ensemble des différentes thématiques. Ce logiciel permet en quelque sorte de voyager facilement au sein de son corpus audio-textuel, et de réécouter ou relire certains passages de manière aisée, car on retrouve les extraits simplement grâce au codage effectué préalablement. Le logiciel permet également d’obtenir des statistiques générales sur tout ou une partie du corpus (durée totale, pourcentage de retranscription, répartition des thématiques, lexicométrie), et de fournir quelques premières statistiques de base (tris à plat). La formation permettra de découvrir les différentes fonctionnalités de ce logiciel libre, et de le prendre en main.

1 MATE-SHS (Méthodes Analyses Terrains Enquêtes en Sciences Humaines et Sociales) est un réseau métier initié et porté par des ingénieur.e.s qui travaillent à la production, au traitement, à l’analyse et à la représentation des données dans la recherche en Sciences Humaines et Sociales (SHS). Pour plus de détails, voir le site des MATE-SHS : http://mate-shs.cnrs.fr/?lang=fr

2 Terme anglais issu de la contraction des mots Web et seminar, que l’on traduit parfois en français par webinaire, désignant un séminaire multimédia et interactif, réunissant des spécialistes, accessible en ligne sur inscription, et que l’on peut suivre, en direct ou en différé, sur le Web, afin de parfaire ses connaissances sur un thème, notamment dans le domaine des technologies de l’information.

Fiche technique n° 1: la numérisation de cassettes audio

Cette fiche technique est consacrée à la numérisation de cassettes audio classiques (format 90min, grand format). Pour les mini-cassettes, utilisées fréquemment pour les dictaphones, il suffit d’utiliser un adaptateur.

Pour numériser vos cassettes audio, vous aurez besoin de deux outils : un petit appareil qui va lire votre cassette et convertir le signal sonore que vous pourrez connecter par USB sur votre ordinateur (un enregistreur-convertisseur) et un logiciel qui, dans la même temps, va enregistrer le signal émis. Le modèle d’enregistreur-convertisseur (USB Cassette Player) que j’utilise pour ma part est le suivant : KONIG Electronic HAV-CA10. Il s’avère peu cher et facile d’utilisation. Toutefois, il existe de nombreux modèles et marques tout aussi performants. La plupart des remarques et conseils donnés ici sont néanmoins valables pour les autres types de convertisseurs. J’utilise par ailleurs comme logiciel de traitement du son Audacity à la fois parce que c’est un logiciel libre, facile d’utilisation et développé par une communauté et non un seul geek au fin fond du Wisconsin susceptible d’arrêter du jour au lendemain le logiciel que vous utilisez depuis dix ans.

Sur l’enregistreur-convertisseur

Branchez la connexion USB à l’ordinateur et laisser le temps à l’ordinateur de trouver le pilote sur Internet. Cela peut prendre quelques minutes. Attention selon que vous utilisez Windows, Mac ou Linux, certains pilotes propriétaires peuvent avoir été conçus pour ne fonctionner que sur un seul système d’exploitation. Renseignez-vous donc avec d’acheter le premier convertisseur pas cher venu sur Internet ou en magasin.

Branchez un casque pour vérifier la sortie volume de l’enregistreur et si la K7 fonctionne.

Mettre le volume au maximum, sauf si cela sature, ce qui arrive rarement pour les enregistrements d’entretiens, sauf ceux avec des conditions d’enregistrement spécifiques (le fameux bar PMU avec la chaîne d’info en continu ou l’enceinte juste en-dessous de la table que vous avez choisi avec l’interviewé pour faire l’entretien).

Prévoyez une cassette « test » de musique afin de se faire un peu la main avec l’enregistreur sans risquer d’abîmer une cassette sur laquelle est enregistré un entretien important, par exemple si on a un doute sur le niveau de volume ou autre.

Rembobinez la cassette au début de la face A. Attention : si vous numérisez une cassette qui a été enregistrée par quelqu’un d’autre (par exemple le chercheur premier dans le cas de réanalyses, les faces A et B ne correspondent pas forcément au même entretien. Par ailleurs le chercheur premier ne commence pas forcément par la face A ni ne renseigne de manière précise, dans les cas de cassettes où une seule face est enregistrée, quelle est la face enregistrée. Par conséquent, je suggère d’enregistrer tout d’un bloc sans trop réfléchir et à retravailler l’ordre des séquences enregistrées lors de la phase du montage audio.

Appuyez sur le « Mode lecture » et sélectionnez l’icône loop. La K7 va automatiquement changer de face et commencer la lecture de l’autre face quand la première est terminée. Petit conseil : sélectionner l’icône loop fait que l’enregistrement peut continuer indéfiniment. Pour ne pas réenregistrer par mégarde la face A, il est conseillé de mettre un réveil à t+ 1h30 lorsqu’on lance un enregistrement. Cela permet d’arriver un peu avant la fin de la face B. Remarque pratique : les cassettes ne font en réalité jamais exactement 90 minutes. On constate en effet que la durée des enregistrements audio va toujours au-delà, parfois jusqu’à plus de vingt minutes supplémentaires et varie d’une cassette à l’autre. Il est probable que le procédé de fabrication des cassettes est tel que cela varie un peu d’une cassette à l’autre (longueur de bande) et que, pour cette raison, le fabricant garantit au moins 90 minutes de manière certaine. Cela implique qu’il faut toujours prévoir plus d’1h30 pour l’enregistrement d’une cassette et de s’organiser en conséquence dans le calendrier de numérisation.

Sur le logiciel Audacity

Définissez l’entrée audio dans Audacity. Assurez-vous qu’elle est définie sur l’entrée ligne en cliquant sur le menu à côté de l’icône du microphone. Sinon aller dans l’onglet « Édition » →

« Préférences » → « Réseau de microphones High definition »

Assurez-vous également de sélectionner si vous souhaitez que l’enregistrement se fasse en mono ou en stéréo. Pour ma part, je sélectionne la mono car c’est des fichiers enregistrés en wav mono que certains logiciels de transcription et de traitement du son comme Sonal peut importer.

Appuyez sur le bouton rouge « Record », puis appuyez sur « Play » sur votre lecteur de cassettes.

Il faut alors vérifier l’amplitude des fréquences. Si celle-ci est très faible, on risque de ne rien entendre sur l’enregistrement. Cela peut être dû à un enquêté parlant peu fort (notamment les plus âgés), à l’enregistreur cassette placé trop loin de l’enquêté lors de l’entretien ou dont le volume a été mal réglé. À l’inverse, si le spectre est trop large, c’est que le volume du son d’entrée est trop fort et que cela va faire saturer le logiciel, rendant l’enregistrement inaudible. Dans ce cas, il convient de baisser le niveau d’entrée du microphone jusqu’à obtenir un spectre raisonnable.

Lorsque vous avez terminé l’enregistrement, appuyez sur le bouton « Stop » avec le carré puis arrêtez votre lecteur de cassettes.

Regardez alors la courbe d’enregistrement pour voir s’il n’y a pas des passages non enregistrés, comme dans le cas où seule une des deux faces de la cassette a été utilisée. Si c’est le cas, l’amplitude des fréquences est très faible. Vous pouvez ensuite sélectionner la partie non enregistrée de la cassette pour pouvoir l’effacer et de ne pas alourdir inutilement votre fichier audio. Pour ce faire, il faut aller dans « Édition » → « Sélectionner ». S’affichent alors trois propositions en fonction desquelles vous placerez comme vous le souhaitez le curseur (le clic de la souris sur la piste audio) :

  • « Tout sélectionner » (inutile ici)

  • « Du début jusqu’au curseur » (utile si la partie inutile enregistrée est avant l’entretien)

  • « Du curseur à la fin » (utile si la partie inutile enregistrée est après l’entretien, comme lorsqu’on a fait tourner l’enregistrement trop longtemps et qu’on est revenu à la face A)

Toutefois, pour les extraits inutiles au milieu de l’entretien (notamment lié au passage de la face A à la face B), cette fonctionnalité n’est pas utilisable. Dans ce cas, deux options. La première consiste à sélectionner manuellement avec la souris le passage puis le couper (sans le coller) ; c’est le plus simple quand le passage en question est court mais très fastidieux et long quand il s’agit d’un extrait d’une dizaine de minutes. La seconde option consiste à placer le curseur au début du passage à couper puis entrer la position audio (type HH:MM:SS) dans le tableau « Fin de la sélection » en bas de la fenêtre. L’ensemble du passage est ainsi sélectionné et il n’y a plus qu’à couper (sans coller).

Cliquez sur l’onglet « Fichier » → « Enregistrer le nouveau projet sous ». Petit conseil : si vous êtes sous Windows, ne pas enregistrer sous « mes documents » ou dans « Ma bibliothèque » mais plutôt dans un dossier directement sur le bureau. Plus la racine du lieu où est enregistré le document est courte, plus c’est sûr.

Une fois le projet audacity enregistré, on peut exporter le fichier en un autre format audio plus polyvalent et/ou moins lourd. La fonction export en fichier PDF connaissant des problèmes sur Audacity (du moins certaines versions), l’astuce consiste à l’exporter en wav puis d’utiliser un logiciel de conversion de formats audio pour le transformer en mp3. Pour cela, il faut cliquer sur l’onglet « Fichier » → « Exporter en WAV ». Puis une fois le fichier Wav généré, vous fermez Audacity pour ouvrir votre logiciel de conversion audio comme par exemple Sound converter sous Ubuntu ou Freemake Audio Converter sous Windows. D’autres logiciels existent bien évidemment. Il vous suffira ensuite d’importer le fichier Wav pour le convertir et générer un nouveau fichier mp3 du même nom. Remarque : pensez ensuite à effacer le fichier wav qui prend de la place par rapport au mp3. Je conseille également d’effacer les fichiers de format audacity générés à chaque projet car ils prennent beaucoup de place sur le disque dur. Vous pouvez toujours par la suite rouvrir le fichier MP3 sur audacity pour effectuer un nouveau travail de montage ultérieur. À ce moment-là un nouveau projet audacity sera généré. Remarque importante : ce que vous gagnez en volume, vous le perdez en pérennité du format. En effet, les fichiers compressés comme le MP3 ou le ogg sont fortement déconseillés par les archivistes et les institutions de conservation des données, comme le CINES pour l’enseignement supérieur1. Les fichiers propriétaires comme le WMA sont également à éviter car les nouvelles versions des logiciels ne garantissent pas longtemps la lecture des fichiers anciens. Le wav est donc plus lourd mais constitue à ce jour le format pérenne par excellence pour le son, vous garantissant de pouvoir réécouter vos enregistrements sous au moins 10 ans.

Si ces conseils ont besoin d’être illustrés par des images en capture d’écran, ou si vous souhaitez lire d’autres tutoriels, présentant les autres manières de numériser le contenu des cassettes audio, voir ici.

1 Le CINES (Centre Informatique National de l’Enseignement Supérieur) est l’équivalent des Archives Nationales pour le numérique appliqué à l’Enseignement supérieur et la recherche. Il propose un certain nombre de services dont son interface FACILE (http://facile.cines.fr/) sur laquelle vous pouvez déposer vis fichiers afin d’en vérifier la pérennité et bénéficier de conseils sur leur éventuelle conversion.


Licence Creative Commons
Fiche technique n° 1: la numérisation de cassettes audio de Thibaut Rioufreyt est mis à disposition selon les termes de la licence Creative Commons Attribution – Pas d’Utilisation Commerciale – Partage dans les Mêmes Conditions 4.0 International.