Bonjour,
En faite j'ai un Homework de classification des images satellitaires. Je suis bloqué au niveau de split tedt train set pour faire un réseau de neurones ( deep learning). Je veux assurer que chaque groupe contient des données unique: pas de redondance dans les pixels. L'algorithme peut être quelques chose près de ca.
def train_valid_test_split (id_array, label_array, bands_array):
# 1- récuper la liste des classes
# boucler sur les classes, récupérer les ID uniques par classes
# faire un random shuffle sur les ID
# diviser la liste des ID (affecter 50% dans une liste train, 20% dans une liste validation, et 30% dans une liste test) à la fin de la boucle, récupérer les idx_train, idx_valid et idx_test en faisant np.where (np.isin( id_array, lstIDTrain/Valid/Test ))
# et renvoyer (return) les données (train/valid/test) des images et les labels sur les tableaux bands_array et label_array
return train_bands, valid_bands, test_bands, train_label, valid_label, test_label
Pourriez vous m'aider à écrire cette fonction SVP ??
# à déplacer
Posté par steph1978 . Évalué à 2 (+0/-0). Dernière modification le 12 novembre 2020 à 12:50.
Ici c'est le suivi du site linuxfr.org, les tickets.
Pour du forum, il y a les … forums : https://linuxfr.org/forums/programmation-python
D'autre part, faut revoir le formatage du message. En l'état, je ne le lis mm pas.
# -> Forum
Posté par Benoît Sibaud (site web personnel) . Évalué à 3 (+0/-0).
La rubrique suivi est destinées aux propositions d'amélioration du site.
Pour des questions à propos de ce type, il faut utiliser les forums.
https://linuxfr.org/posts/nouveau
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.