Création du site

Lors de la création du site, nous avons d’abord pensé nous inspirer du code source d’un site existant. Cependant devant la difficulté du code html, nous avons opté pour l’utilisation d’un outil d’aide à la création de site web.

Une fois les cadres généraux de notre site web posés (https://l-homosexualite-sur-le-web.hubside.fr/) nous avons récupéré le code source du site créé afin de l’étudier et de l’adapter à notre machine en local.

Choix de l’expression régulière

Suite à l’ajout dans le script de création du tableau d’un 3ème paramètre $3 contenant le motif, nous nous demandons sur quels expressions nous baser pour déterminer les lignes de contexte.

Nous décidons de créer deux tableaux différents (et donc deux expressions régulières) pour chaque langue: un pour les mots dénotant l’homosexualité de manière neutre et un autre pour les mots déjà connotés négativement en soi.

Pour le français, nous avons donc: « homosexu(el(le)?s?)alité|gays?|lesbien(ne)?s? »

Pour l’anglais: »homo(sexual(ity)?s?)?|gay(ness)?s?)|LGBTQ?I? »

Pour l’espagnol: « homosexual(i(smo|dad)|es)? »

Pour construire tous les tableaux, on les réunit toutes en une avec le pipe.

Difficultés

Après avoir lancé la ligne de commande $ bash premier_script.sh ../URLS/ ../URLS/

Avec les deux arguments $1 et $2 qui consistent à input ($1) et output ($2), je constate qu’au niveau de la page html générée deux tableaux apparaissent avec pas mal d’erreur de code. Cela est dû au répertoire output qu’on avait ciblé(URLS). Toutefois, après avoir changé de répertoire cible « TABLEAUX », je vois qu’un seul tableau apparaît et cela fonctionne bien.

Par contre pour la création des pages aspirées, le programme n’arrive pas à le créer. Un message d’erreur apparaît (« 0Warning: failed to create the file ./PAGES-ASPIREES/1-19.html: aucun fichier

Problème avec le script

Je tente de créer le tableau à l’aide du script fait en cours. Je lui passe deux arguments $1 et $2 qui correspondent respectivement au chemin où se trouvent mes urls et où je veux créer le tableau. les commandes « curl » cependant me signalent qu’elles trouvent des caractères illégaux dans les urls.

Le tableau a été créé mais dans la ligne http, j’obtiens le code « 200 » pour toutes les urls sauf la dernière ou j’obtiens bien 200. De même pour l’encodage qui est vide sauf la dernière qui m’indique utf-8.

Problème avec les urls de langue anglaise

Nous étant fixé comme objectif de comparer des représentations à travers les corpus de plusieurs pays d’Europe, nous nous sommes heurtés à un problème avec la langue anglaise. Celle-ci étant utilisée comme langue véhiculaire dans le monde entier et comme langue vernaculaire dans divers pays autre que le Royaume-uni, notamment aux états-unis, il y a un risque de choisir des textes qui n’ont pas été écrits dans un cadre britannique. Pour y remédier, nous allons tenter de cibler des journaux publiés uniquement au Royaume-uni.

Le même souci risque d’apparaître avec l’espagnol et les pays d’Amérique du sud.

Exercices (phase 3)

Nous avons créé un programme qui écrit « valentin » dans un nouveau fichier « ligne1.txt » puis fait de même pour « homosexualité » dans un fichier ligne2.txt. Ensuite il concatène le contenu de ces deux fichiers et redirige le résultat dans un nouveau fichier « deuxlignes.txt » dans le répertoire « DUMP-TEXT ».

Nous exécutons le programme. Il fonctionne!

Le tableau que nous devons créé est identique à celui que nous avons créé plus haut. Aussi nous créons un programme qui utiliser le commande « cp » pour récupérer le tableau de départ situé dans le répertoire parent du répertoire parent et le copier dans le répertoire « TABLEAUX ». Nous aurions pu aussi réécrire tout le programme et le rediriger dans un nouveau fichier html à l’aide de la commande echo.

Le programme crée bien le fichier html demandé qui a bien l’effet escompté comme déjà testé plus haut.

Exercices (html)

Nous avons créé un document html que nous avons modifié avec notepad++. Nous avons signalé le type de document et mis au format html à l’aide de balises dédiées. L’encodage est utf8. Le titre est « Valentin ». A l’interieur des balises « body » nous avons créé un tableau avec les balises « table » avec comme attributs une bordure de taille 1. Il n’y a qu’une seule cellule (balisées avec « td ») par ligne (« tr »), la première cellule est balisée avec « th » pour indiquer qu’il s’agit d’une en-tête. La cellule d’en tête à comme contenu « Valentin-Gabriel » et la cellule de la seconde ligne a comme contenu notre nom de projet. Chaque balise après avoir été ouverte et son contenu indiqué est refermée.

On affiche le tableau en cliquant sur le document. Le tableau correspond bien à ce que nous avons écrit: deux lignes, une cellule par ligne avec une entête et une bordure de 1.

Exercices (suite)

Nous avons créé une liste des dossiers dans le répertoire TEST2 à l’aide de la commande « ls » puis à l’aide du tube « | » nous avons redirigé cette liste vers l’entrée de la commande « wc » accompagné de l’option « -l » pour compter le nombre de lignes dans cette liste, soit le nombre de dossiers dans TEST2.

Nous avons utilisé les commandes « ls », « who » et « pwd » séparées de « ; » : Les commandes s’executent à la suite dans l’ordre, une ligne par commande. La commande « who » ne semble pas fonctionner, aussi je la remplace par la commande « whoami » qui elle me donne mon nom d’utilisateur connecté.

En regroupant deux commandes avec les parenthèses, la redirection de la sortie s’applique sur les deux commande à la fois. Ainsi, elles sont toutes deux redirigées simultanément dans le nouveau fichier « qui ». Les exécutions sont simultanées car le résultat de la première commande n’est pas écrasée par le résultat de la seconde comme ce serait le cas avec le chevron simple consécutivement.

L’utilisation de $ puis parenthèses permet d’imbriquer le résultat d’une commande à l’intérieur d’une autre commande. Ici le chemin du répertoire courant appelé par « pwd » est imbriqué dans la chaine de caractère renvoyé par la commande « echo ».

Concevoir un site comme celui-ci avec WordPress.com
Commencer