python - Dataframe - colonna - modifica

dopo aver definito il DataFrame rimuovere righe duplicate

si usano metodi diversi a seconda del tipo di oggetto

metodi

pandas.DataFrame

vedi https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.drop_duplicates.html

.drop_duplicates()

sintassi
df.drop_duplicates() in base a tutte le colonne

df.drop_duplicates(subset=['colonna]) in base alla colonna indicata
df.drop_duplicates(subset=['colonna,colonna,...]) in base alle colonne indicate

df.drop_duplicates(subset=['colonna],keep='last') mantiene l'ultima riga invece della prima

colonna con gli indici

.drop_duplicates()

.reset_index(drop=True)

(veri Python - Dataframe - indice)

numpy.ndarray

rimuove duplicati .unique()

df["Product"].unique()

esempio: da una tabella faccio la lista unica dei prodotti
df["Prodotto"].unique()

pandas.Series

rimuovi duplicati mantenendo l'intestazione df[~df.duplicated()]

df[~df.duplicated()]

conversione in set

set

variabile = set(df["colonna"])

document.write(document.title.substr(0,document.title.indexOf("-")).trim().toUpperCase() + " - " + document.title.substr(document.title.indexOf("-")+1).trim().toLowerCase())