Documentation du Job
Generated by Talend Open Studio for Data Integration


Nom du projetBDD_PhytoDate de génération3 sept. 2012 14:04:10
Créé par :alain.benard@nancy.inra.frTalend Open Studio VERSION 5.0.0.r72978

Summary

Description du projet
Description
Preview Picture
Paramètres
Liste des contextes
Liste des composants
Description du composant


Description du projet


PropriétésValeurs
NomBDD_Phyto
Languejava
Description
Base de données Phyto écologie (Floristique - Dendro(s) - Sol)


Description


PropriétésValeurs
Nombryophyte_europe
Créé par :alain.benard@nancy.inra.fr
Version1.0
ObjectifIntégration des espèces de la liste des bryophytes (2008 en version 1.0 du job) dans la table des espèces (tr_espece_esp) de la base db_phyto
StatutPROD
Description
Alimentation de la table des espèces à partir du fichier excel de la liste des bryophytes 2008 (BDNBE v.1 Cécile Lemonni
er - Idiotaxon version 19/02/2008) . Ce tableau présente les caractéristiques suivantes :• La colonne NOMEN (2° colonne) représente l'identifiant dans la BDNBE et alimentera le champ esp_identifiant_ext permet
tant la traçabilité au sein de la source des données• La 4° colonne contient le nom de la bryophyte qui alimentera le champ nom de la table des espèces dans la base db_phyt
Le job intégrera l'ensemble des lignes (2496).
Avant l'utilisation de ce job il convient de créer un enregistrement dans la table tr_origine_ori de la base db_phyto re
présentant la BDNBE 2008. L'identifiant numérique de cet enregistrement doit être fourni au contexte du job (valeur du c
hamp ori_id à placer dans la variable de context id_flore_origine)
Création21 févr. 2011 09:21:11
Modification3 sept. 2012 10:27:33

Preview Picture


No image available
tFileInputExcel_1tFileOutputDelimited_1tLogRow_1tMap_1tPostgresqlCommit_1tPostgresqlConnection_1tPostgresqlOutput_1tUniqRow_3

Paramètres

Paramètres supplémentaires

NomValeur
COMP_DEFAULT_FILE_DIRD:/tos/TOS_DI-Win32-r72978-V5.0.0/workspace
Exécution multi threadfalse
tContextLoad implicitefalse


Stats & Logs

NomValeur
Utiliser les statistiques (tStatCatcher)false
Utiliser les logs (tLogCatcher)false
Utiliser les volumes (tFlowMeterCatcher)false
Dans la consolefalse
Dans des fichiersfalse
Dans la base de donnéesfalse
Capturer les statistiques des composantsfalse
Capturer les erreurs de l'exécutabletrue
Capturer les erreurs de l'utilisateurtrue
Capturer les alertes à l'utilisateurtrue


Liste des contextes

Contexte :Default

NomPromptNeed Prompt?TypeValeurSource
fichierbdnbefichierbdnbe?falseid_StringnullCTX_Chemins
fichiernum_taxo_doublonfichiernum_taxo_doublon?falseid_StringnullCTX_Chemins
DB_Phyto_DatabaseDB_Phyto_Database?falseid_String
DB_Phyto_LoginDB_Phyto_Login?falseid_String
DB_Phyto_PasswordDB_Phyto_Password?trueid_Password******
DB_Phyto_PortDB_Phyto_Port?falseid_String
DB_Phyto_SchemaDB_Phyto_Schema?falseid_String
DB_Phyto_ServerDB_Phyto_Server?falseid_String
id_flore_origineid_flore_origine?falseid_IntegerVariables


Contexte :production

NomPromptNeed Prompt?TypeValeurSource
fichierbdnbefichierbdnbe?falseid_String//mandragore/phyto/bdd/base_phyto/floristique/flores/Liste_des_bryophytes_d'Europe_2008.xlsCTX_Chemins
fichiernum_taxo_doublonfichiernum_taxo_doublon?falseid_String//mandragore/phyto/bdd/base_phyto/floristique/integration/log/doublon_numtaxo.csvCTX_Chemins
DB_Phyto_DatabaseDB_Phyto_Database?falseid_Stringdb_phyto
DB_Phyto_LoginDB_Phyto_Login?falseid_Stringalbenard
DB_Phyto_PasswordDB_Phyto_Password?trueid_Password******
DB_Phyto_PortDB_Phyto_Port?falseid_String5432
DB_Phyto_SchemaDB_Phyto_Schema?falseid_Stringpublic
DB_Phyto_ServerDB_Phyto_Server?falseid_Stringpggeodb.nancy.inra.fr
id_flore_origineid_flore_origine?falseid_Integer5Variables


Contexte :test

NomPromptNeed Prompt?TypeValeurSource
fichierbdnbefichierbdnbe?falseid_String//mandragore/phyto/bdd/base_phyto/floristique/flores/Liste_des_bryophytes_d'Europe_2008.xlsCTX_Chemins
fichiernum_taxo_doublonfichiernum_taxo_doublon?falseid_StringD:/projets/BDD Phyto/codifications/doublon_numtaxo.csvCTX_Chemins
DB_Phyto_DatabaseDB_Phyto_Database?falseid_Stringdb_phyto
DB_Phyto_LoginDB_Phyto_Login?falseid_Stringadmin
DB_Phyto_PasswordDB_Phyto_Password?trueid_Password******
DB_Phyto_PortDB_Phyto_Port?falseid_String5432
DB_Phyto_SchemaDB_Phyto_Schema?falseid_Stringpublic
DB_Phyto_ServerDB_Phyto_Server?falseid_Stringbdd.nancy.inra.fr
id_flore_origineid_flore_origine?falseid_Integer5Variables


Contexte :avignon

NomPromptNeed Prompt?TypeValeurSource
dossier_basedossier_base?falseid_StringD:/tos/donnees/geonetavignon/global
sous_dossier_tmpsous_dossier_tmp?falseid_String/Integration/tmp
sous_dossier_modelessous_dossier_modeles?falseid_String/Modeles
sous_dossier_logsous_dossier_log?falseid_String/Integration/log
fichierbdnfffichierbdnff?falseid_StringD:/projets/BDD Phyto/codifications/bdnffv5.xlsx
fichiernum_taxo_nullfichiernum_taxo_null?falseid_StringD:/projets/BDD Phyto/codifications/log/num_taxo_null.csv
fichiernum_taxo_doublonfichiernum_taxo_doublon?falseid_StringD:/projets/BDD Phyto/codifications/doublon_numtaxo.csv
fichiergenresfichiergenres?falseid_StringD:/projets/BDD Phyto/codifications/Dictionnaire_des_noms_de_genres_utf8.dic
fichiergenre_bddseulfichiergenre_bddseul?falseid_StringD:/projets/BDD Phyto/codifications/rejet_genresbddseul.csv
fichiergenre_dicoseulfichiergenre_dicoseul?falseid_StringD:/projets/BDD Phyto/codifications/rejet_genresdicoseul.csv
fichierbdnbefichierbdnbe?falseid_String//mandragore/phyto/bdd/base_phyto/floristique/Liste_des_bryophytes_d'Europe_2008.xls
DB_Phyto_PasswordDB_Phyto_Password?trueid_Password******DB_Phyto
DB_Phyto_LoginDB_Phyto_Login?falseid_StringadminDB_Phyto
DB_Phyto_DatabaseDB_Phyto_Database?falseid_Stringdb_phytoDB_Phyto
DB_Phyto_ServerDB_Phyto_Server?falseid_Stringbdd.nancy.inra.frDB_Phyto
DB_Phyto_PortDB_Phyto_Port?falseid_String5432DB_Phyto
DB_Phyto_SchemaDB_Phyto_Schema?falseid_StringpublicDB_Phyto




Liste des composants

Nom du composantType de composant
tFileInputExcel_1tFileInputExcel
tFileOutputDelimited_1tFileOutputDelimited
tLogRow_1tLogRow
tMap_1tMap
tPostgresqlCommit_1tPostgresqlCommit
tPostgresqlConnection_1tPostgresqlConnection
tPostgresqlOutput_1tPostgresqlOutput
tUniqRow_3tUniqRow

Description du composant

Composant :   tFileInputExcel

      UNIQUE NAMEtFileInputExcel_1INPUT(S)tPostgresqlConnection_1
Libellébdnde 1.0OUTPUT(S)tMap_1,  tLogRow_1

Paramètres du composant :
PropriétésValeurs
Activertrue
Statistiques du tStatCatcherfalse
Lire un fichier au format excel2007 (xlsx)false
Nom de fichier/Fluxcontext.fichierbdnbe
Toutes les feuillesfalse
Liste des feuilles[{USE_REGEX=, SHEETNAME="Liste 2008 et Classification"}]
En-tête3
Pied-de-page0
Limite
Affecte chaque feuille (en-tête et pied de page)false
Première colonne1
Dernière colonne
Terminer en cas d'erreurfalse
Séparateur avancé (pour les nombres)false
Supprimer les espaces en début et en fin de champ dans toutes les colonnesfalse
Sélectionnez la colonne dans laquelle vous voulez supprimer les espaces entourant les champs[{SCHEMA_COLUMN=Taxo, TRIM=false}, {SCHEMA_COLUMN=Nomen, TRIM=false}, {SCHEMA_COLUMN=Catminat, TRIM=false}, {SCHEMA_COLUMN=espece, TRIM=false}, {SCHEMA_COLUMN=Annee, TRIM=false}, {SCHEMA_COLUMN=Famille, TRIM=false}, {SCHEMA_COLUMN=Sous_ordre, TRIM=false}, {SCHEMA_COLUMN=Ordre, TRIM=false}, {SCHEMA_COLUMN=Super_Ordre, TRIM=false}, {SCHEMA_COLUMN=Sous_Classe, TRIM=false}, {SCHEMA_COLUMN=Classe, TRIM=false}, {SCHEMA_COLUMN=Embranchement, TRIM=false}]
Encodage"ISO-8859-1"
Lire les valeurs réelles pour les nombresfalse
Terminer la lecture sur ligne videfalse
Ne pas valider les cellulesfalse
Ignorer l'avertissementfalse
Afficher les informationsfalse
CommentaireFichier Excel des Bryophytes d'Europe (2008). Téléchargeable sur le site http://www.tela-botanica.org.
Utiliser une règle de validation existantefalse

Schéma demetadata :
ColumnCléTypeLongueurPrécisionNullableCommentaire
TaxofalseString5true
NomenfalseString6true
CatminatfalseString13true
especefalseString255true
AnneefalseString11true
FamillefalseString16true
Sous_ordrefalseString16true
OrdrefalseString15true
Super_OrdrefalseString8true
Sous_ClassefalseString15true
ClassefalseString17true
EmbranchementfalseString15true

Original Function Parameters:
Composant :   tFileOutputDelimited

      UNIQUE NAMEtFileOutputDelimited_1INPUT(S)tUniqRow_3
LibelléDoublons Num_TaxoOUTPUT(S)none

Paramètres du composant :
PropriétésValeurs
Activertrue
Statistiques du tStatCatcherfalse
Use Output Streamfalse
Nom de fichiercontext.fichiernum_taxo_doublon
Séparateur de lignes"\n"
Séparateur de champs";"
Ecrire aprèsfalse
Inclure l'en-têtefalse
Compresser en tant que fichier zipfalse
Séparateur avancé (pour les nombres)false
Options CSVfalse
Créer le répertoire s'il n'existe pastrue
Diviser la sortie dans plusieurs fichiersfalse
Personnaliser la taille de la mémoire utilisée pour stocker temporairement les donnéesfalse
Sortie en mode lignefalse
Encodage"ISO-8859-15"
Ne pas générer de fichier videfalse
Afficher les informationsfalse
CommentaireFichier de log des num_taxonomique en doublons. Dans la version 1.0 de la BDNBE il n'y a aucun doublon.
Utiliser une règle de validation existantefalse

Schéma detFileOutputDelimited_1 :
ColumnCléTypeLongueurPrécisionNullableCommentaire
nom_especefalseString255true
id_orifalseIntegertrue
num_taxonomiquefalseString8true

Original Function Parameters:
Composant :   tLogRow

      UNIQUE NAMEtLogRow_1INPUT(S)tFileInputExcel_1
Libellé__UNIQUE_NAME__OUTPUT(S)none

Paramètres du composant :
PropriétésValeurs
Activertrue
Statistiques du tStatCatcherfalse
Basiquetrue
Tableau (afficher les valeurs dans les cellules d'un tableau)false
Vertical (chaque ligne est une liste de clé/valeur)false
Séparateur de champs"|"
Imprimer l'en-têtefalse
Afficher le nom unique du composant en face de chaque ligne de sortiefalse
Affiche le nom des colonnes du schéma en face de chaque valeurfalse
Utiliser une longueur fixe pour les valeursfalse
Afficher les informationsfalse
CommentaireConsole pour les messages de rejet en cas de problème sur le fichier Excel.
Utiliser une règle de validation existantefalse

Schéma demetadata :
ColumnCléTypeLongueurPrécisionNullableCommentaire
TaxofalseString5true
NomenfalseString6true
CatminatfalseString13true
especefalseString255true
AnneefalseString11true
FamillefalseString16true
Sous_ordrefalseString16true
OrdrefalseString15true
Super_OrdrefalseString8true
Sous_ClassefalseString15true
ClassefalseString17true
EmbranchementfalseString15true
errorCodefalseString255true
errorMessagefalseString255true

Original Function Parameters:
Composant :   tPostgresqlCommit

      UNIQUE NAMEtPostgresqlCommit_1INPUT(S)tPostgresqlOutput_1
LibelléCommit transactionOUTPUT(S)none

Paramètres du composant :
PropriétésValeurs
Activertrue
Statistiques du tStatCatcherfalse
Liste des composantstPostgresqlConnection_1
Fermer la connexiontrue
Afficher les informationsfalse
CommentaireCommit de la transaction d'insertion des espèces.
Utiliser une règle de validation existantefalse

Schéma detPostgresqlCommit_1 :
ColumnCléTypeLongueurPrécisionNullableCommentaire

Original Function Parameters:
Composant :   tPostgresqlConnection

      UNIQUE NAMEtPostgresqlConnection_1INPUT(S)none
LibelléDB_PhytoOUTPUT(S)tFileInputExcel_1

Paramètres du composant :
PropriétésValeurs
Activertrue
Statistiques du tStatCatcherfalse
Hôtecontext.DB_Phyto_Server
Portcontext.DB_Phyto_Port
Base de donnéescontext.DB_Phyto_Database
Schémacontext.DB_Phyto_Schema
Utilisateurcontext.DB_Phyto_Login
Mot de passecontext.DB_Phyto_Password
Utiliser ou enregistrer une connexion partagée à une base de donnéesfalse
Commit automatiquefalse
Afficher les informationstrue
CommentaireConnexion à la base db_phyto
Utiliser une règle de validation existantefalse


Original Function Parameters:
Composant :   tPostgresqlOutput

      UNIQUE NAMEtPostgresqlOutput_1INPUT(S)tUniqRow_3
Libellétr_espece_espOUTPUT(S)tPostgresqlCommit_1

Paramètres du composant :
PropriétésValeurs
Activertrue
Statistiques du tStatCatcherfalse
Utiliser une connexion existantetrue
Liste des composantstPostgresqlConnection_1
Table"tr_espece_esp"
Action sur la tableNONE
Action sur les donnéesINSERT
Schéma
Terminer en cas d'erreurfalse
Colonnes supplémentaires[]
Utiliser les options des champsfalse
Activer le mode débogagefalse
Supporter des valeurs null dans la clause "WHERE SQL"false
Utiliser la taille des lotstrue
Taille des lots10000
Afficher les informationstrue
CommentaireTable des espèces de la base de données
Utiliser une règle de validation existantefalse

Schéma detPostgresqlOutput_1 :
ColumnCléTypeLongueurPrécisionNullableCommentaire
nom_especefalseString255true
id_orifalseIntegertrue
num_taxonomiquefalseString8true

Original Function Parameters:
Composant :   tUniqRow

      UNIQUE NAMEtUniqRow_3INPUT(S)tMap_1
LibelléDoublons Num_TxoOUTPUT(S)tPostgresqlOutput_1,  tFileOutputDelimited_1

Paramètres du composant :
PropriétésValeurs
Activertrue
Statistiques du tStatCatcherfalse
Clé unique[{CASE_SENSITIVE=false, KEY_ATTRIBUTE=false, SCHEMA_COLUMN=nom_espece}, {CASE_SENSITIVE=false, KEY_ATTRIBUTE=false, SCHEMA_COLUMN=id_ori}, {CASE_SENSITIVE=false, KEY_ATTRIBUTE=true, SCHEMA_COLUMN=num_taxonomique}]
Seulement une fois chaque clé dupliquéefalse
Utiliser le disque (convient au traitement d'un grand nombre de lignes)false
Afficher les informationstrue
CommentaireSupprime les doublons sur le champ num_taxonomique
Utiliser une règle de validation existantefalse

Schéma detUniqRow_3 :
ColumnCléTypeLongueurPrécisionNullableCommentaire
nom_especefalseString255true
id_orifalseIntegertrue
num_taxonomiquefalseString8true

Original Function Parameters:
Composant :   tMap

      UNIQUE NAMEtMap_1INPUT(S)tFileInputExcel_1
LibelléExtraction informations BDNBEOUTPUT(S)tUniqRow_3