(ça n'a aucun rapport avec les 22 ans, mais bon d'ici qu'on le fasse, « nettoyage de printemps » sera hors saison)
Un peu de ménage en base de données ne ferait pas de mal, pour diverses raisons (ça prendrait moins de place, on stocke des choses inutiles, on stocke des données personnelles obsolètes pour rien, etc.).
Commençons par un nettoyage suite au Un an après la mise à jour majeure du site, grand nettoyage dans les comptes utilisateur, qui nous définit une date cible au 31 mars 2012.
- supprimer les étiquettes posées sur les contenus non publics antérieurs à la date ciblée (de fait invisibles, mais a priori il n'y en a pas avant RoR)
- supprimer les commentaires sur les contenus non publics antérieurs à la date ciblée (de fait invisibles)
- supprimer les contenus non publics antérieurs à la date ciblée (de fait invisibles)
- purger les comptes (accounts+users) créés avant la date ciblée et toujours fermés (dont personne n'a demandé leur réouverture) et qui ne sont associés à aucun commentaire, aucun contenu ou aucune étiquette (aucun intérêt à les garder)
- purger les comptes (accounts) créés avant la date ciblée et toujours fermés (dont personne n'a demandé leur réouverture) et qui sont associés à un commentaire ou un contenu ou une étiquette (plus délicat si on doit confirmer plus tard l'auteur pour savoir si on peut anonymiser par exemple…)
- globalement relancer les scripts de vérification des bases SQL et Redis
- probablement un peu de optimize à faire côté MariaDB
# Brouillon
Posté par Benoît Sibaud (site web personnel) . Évalué à 3 (+0/-0).
(pour 103k étiquettes actuellement)
(pour 1,8M de commentaires actuellement)
(pour 106k contenus actuellement)
(pour 45k comptes actuellement)
on parle globalement de l'ensemble des comptes concernés moins ceux précédemment trouvés soit :
(pour 45k comptes actuellement)
[^] # Re: Brouillon
Posté par Benoît Sibaud (site web personnel) . Évalué à 4 (+0/-0).
Il faut aussi prendre en compte les comptes qui ont été modérateurs (
news.moderator_id
) et ceux qui ont modifié des dépêches (news_versions.user_id
).# Résultats
Posté par Benoît Sibaud (site web personnel) . Évalué à 4 (+0/-0).
[^] # Re: Résultats
Posté par Ysabeau 🧶 (site web personnel, Mastodon) . Évalué à 2 (+0/-0).
Chapeau et merci !
Il reste encore beaucoup de ménage à faire ? Pour ma curiosité personnelle, ça prend beaucoup de temps de faire le ménage comme ça ?
« Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.
[^] # Re: Résultats
Posté par Benoît Sibaud (site web personnel) . Évalué à 4 (+0/-0).
Aux alentours d'une heure pour l'instant à cause des surprises. Et il reste deux actions à finir : corriger les stats de modération, refaire une vérification en base (j'ai notamment oublier de nettoyer des slugs), et pourquoi pas lancer un OPTIMIZE en base de données mais ça ne coûte rien. Ah oui, optimiser le comptage jusqu'à deux aussi.
[^] # Re: Résultats
Posté par Benoît Sibaud (site web personnel) . Évalué à 4 (+0/-0).
Opération finie.
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.