Quelle est la différence entre une donnée, une information et un contenu ?
La donnée est un élément de l'information qui elle-même est présente dans un contenu.
Qu'est-ce qui définit un document ?
Un document est constitué d'un certain nombre d'informations qui elles-mêmes contiennent un certain nombre de données, le tout présenté sur un support physique (papier) ou numérique de façon structurée ou pas. Il est en général le résultat d'un processus métier pour une entreprise ou d'une demande pour un client particulier.
À quoi sert un moteur d'OCR ?
L'OCR (Optical Character Recognition) permet de reconnaître automatiquement des fichiers imprimés, images et de les convertir en formats électroniques, exploitables informatiquement. Il est très utilisé pour le traitement de texte de meilleure qualité, la gestion de documents, ou encore le classement de fichiers. En exemple, on peut citer quelques documents connus : bon de commande, facture, bulletin de paie, pièces d'identité, passeports, documents et formulaires manuscrits, contrats, devis...
Que regroupe l'Open Data ?
Il s’agit de données libres d’accès et d’utilisation, disponibles en ligne. Tout utilisateur peut les récupérer, les modifier, les combiner et les partager sans aucune restriction technique, juridique ou financière. Ces données regroupent des informations provenant par exemples de gouvernements, d’organisations publiques, d’institutions ou d’entreprises privées.
Que veut dire EIM - Enterprise Information Management ?
L'Enterprise Information management regroupe un ensemble de processus opérationnels, de règles et de pratiques utilisés pour gérer l'information créée à partir des données d'une organisation, qu'elles soient structurées (base de données, datawarehouse, systèmes) et non structurées (images, audios, documents numériques et/ou physiques) : la qualité, l'intégration, le traitement, la gouvernance, les évènements, le cycle de vie (création, capture, l'utilisation, diffusion, stockage, archivage, destruction). Au-delà de la recherche d’efficacité pour une entreprise, l’EIM participe à la conformité légale pour de nombreuses entreprises, car les informations commerciales ont des exigences spécifiques en matière de conservation et de suppression.
À quoi correspond l'étape de labellisation ?
La labellisation est une étape indispensable du Machine Learning. Elle consiste à assigner des étiquettes aux données et c’est ce qui permettra au réseau d’apprendre à reconnaître et à distinguer les différentes catégories. Il est donc impératif d’étiqueter les données préalablement en vue d'un apprentissage supervisé.