Primo quesito: vorrei fare un esercizio abbastanza stupido, niente di complesso, e analizzare dei dati di vendita per vedere se ci sono delle strutture, delle regolarità di abbinamento negli acquisti di diversi articoli. In una parola una cluster analysis.
Ho a disposizione dei dati sulla base degli ordini di vendita, esempio:
Ordine Materiale
1 A
1 B
1 C
2 A
2 B
3 B
3 C
Il dubbio che ho è sul come costruire la matrice delle
L'idea era di costruire un'indice che faccia il rapporto fra il numero di ordini che due articoli hanno in comune e il numero totale di ordine che comprendono i due articoli.
Come idea:.....la dimensione dell'intersezione diviso la dimensione del'insieme unione.
Ho googlato poco e male finora, ma mi è saltato fuori il nome dell'indice di Jaccard, che non ho ancora capito se fa al caso mio o no
Ah, come strumento principale userei R.. avete idea se esiste già un qualche pacchetto/funzione che faccia cose simili??