Python per Excel metodi per analizzare il testo
- contiene .str.contains()
il metodo .str.contains()
restituisce VERO (TRUE) se contiene il testo o FALSO (FALSE) se non lo contiene (keysensitive)
utile per i filtri nei Dataframe
esempio
Dataframe iniziale
il metodo
df["Prodotto"].str.contains("Prodotto B")
restituisce una lista di VERO o FALSO:
- non numero .notna()
il metodo .notna() restituisce vero se il valore non é numero
utile per fare un filtro delle righe non numeri
df = df[df['Column1'].notna()]
- inizia per .str.startswith()
il metodo .str.startswith() restituisce vero se il testo inizia per quello indicato
utile per fare un filtro delle righe con testo inizia per
df = df[df['Column1'].str.startswith('testo iniziale')]
- in una lista .isin
il metodo .isin() restituisce vero se un testo é presente in una lista
utile per fare un filtro delle righe con testo in una colonna presente in una lista
df = df[df['Column1'].isin(['value1', 'value2', 'value3'])]
- numero di righe .shape[0]
restituisce il numero di righe di un Dataframe
numero_righe = df.shape[0]
esempio: righe non vuote
righe_non_vuote = df.dropna().shape[0]