Comment effectuer une transcription parole-texte de vidéo YouTube avec OpenAI Whisper

Open AI Whisper

De nos jours, les vidéos en ligne sont devenues l’un des médias les plus populaires pour l’apprentissage, le divertissement, l’information et bien plus encore. Cependant, pour les personnes qui ne maîtrisent pas la langue dans laquelle une vidéo est présentée, il peut être difficile de tirer profit de tout le contenu disponible. C’est là que … Lire la suite

Scraping de site Web avec protection WAF

Python/Playwright web scraping

Imaginez que vous êtes un analyste de données qui tente de recueillir des informations précieuses pour votre entreprise. Vous savez qu’une mine d’or d’informations se trouve sur un site Web particulier, mais il y a un obstacle majeur : le site est protégé par un WAF, ou un pare-feu d’application Web. C’est un problème courant … Lire la suite

Exemple pratique d’utilisation de ChatGPT en Python

Comment utiliser ChatGPT avec Python ?

Au moment où nous écrivons ces lignes, ChatGPT n’a pas encore fourni de SDK officiel à utiliser. Dans cet article, je vous présente l’utilisation d’un SDK open source, ChatGPT-Wrapper, pour vous aider à incorporer ChatGPT dans votre application Python avec les avantages et les inconvénients énoncés. Qu’est-ce que ChatGPT ? ChatGPT est un modèle d’outil … Lire la suite

Utilisation de Pydantic pour valider les données d’un fichier Open Document Spreadsheet (ODS)

Validation des données d'un fichier Open Document Spreadsheet (ODS) avec Python Pydantic

Lors de mes différents développements sur le traitement de données, je rencontre fréquemment des situations où j’ai construit des automatismes basés sur des données générées par l’utilisateur à partir d’un document Open Document Spreadsheet (ODS). La flexibilité de ce format ouvert de données permet d’être utilisé par une grande variété d’utilisateurs, mais malheureusement, cette flexibilité … Lire la suite

Erreurs asyncio courantes en Python, comment les éviter ?

Le module Asyncio est une API permettant de faire de la programmation asynchrone en Python avec l’utilisation de coroutines. La mise en œuvre de cette API peut être frustrant pour les débutants. La raison en est une série d’erreurs courantes commises lors de la programmation des coroutines avec l’API Asyncio. Dans ce tutoriel, vous découvrirez … Lire la suite

Démarrer avec l’API Mastodon en Python

API Python Mastodon

Avec tout ce qui se passe sur Twitter, de nombreux utilisateurs se tournent vers les réseaux sociaux décentralisés tels que Mastodon. Mastodon est un réseau social gratuit (et open source) complètement décentralisée qui fonctionne à peu près comme Twitter. On peut publier des « toots » (au lieu de tweets), des images et autres contenus, … Lire la suite

Comment, en Python, convertir au format JSON un objet de type ‘set’

Comment sérialiser un objet Set

En Python, par défaut, l’objet de type ‘set’ n’est pas sérialisable. En conséquence, il n’est pas possible d’utiliser la fonction json.dumps() sur ce type d’objet sous peine d’avoir l’erreur Python : TypeError: set([]) is not JSON serializable. La notation JSON (JavaScript Object Notation) ne permet nativement que de sérialiser les types/structures de données suivantes : JSON Python … Lire la suite

Comment traiter des fichiers JSON volumineux en Python

Si vous devez traiter un fichier JSON (JavaScript Object Notation) volumineux en Python, il est très facile de manquer de mémoire. Même si les données brutes tiennent théoriquement dans la mémoire, le chargement en Python peut augmenter encore plus l’utilisation de la mémoire. La conséquence étant que soit le traitement sera de plus en plus … Lire la suite

Comment faire des requêtes POST en utilisant Playwright ?

Effectuer des requêtes POST avec Playwright

Faire des requêtes POST est une technique cruciale pour l’automatisation du Web et le Web Scraping. Voyons comment réaliser cette fonctionnalité avec le framework Playwright. L’automatisation du Web est un moyen technique par lequel les actions effectuées sur Internet, via les navigateurs Web, sont réalisées de manière automatisée. Cela inclut la lecture et la réponse, … Lire la suite