L'unità staccata in Genova dell’Istituto di Linguistica Computazionale (ILC) è sorta in seguito al processo di riordino degli Istituti del Consiglio Nazionale delle Ricerche avvenuto nel 2002 ed è costituita da personale che afferiva all’Istituto per i Circuiti Elettronici.
L’Unità Staccata di Genova è formata da due unità di personale che si sono occupate dal 1986 di linguistica computazionale e dedicate prevalentemente alla lessicografia automatizzata, alla creazione di corpora di riferimento della lingua scritta, alla implementazione di algoritmi di statistica linguistica. Il gruppo di ricerca ha pubblicato articoli, libri e realizzato risorse di tipo linguistico relativamente alla lingua italiana e spagnola. Le risorse create e disponibili sono corpora testuali della lingua scritta, lessici di frequenza, formari, raccolte terminologiche, cataloghi di alterati e lessemi complessi e strumenti software necessari per la creazione, validazione, analisi di tali risorse.