Encuentra similitudes léxicas en textos en C, C ++, Java, Pascal, Modula-2, Lisp, Miranda y text. Esto se puede usar para detectar fragmentos de código potencialmente duplicados en grandes proyectos de software y para detectar plagio en software y proyectos basados en texto, educativos y de otro tipo. Los ejecutables empiezan por "sim_": sim_8086, sim_c, sim_c++, sim_java, sim_lisp, sim_m2, sim_mira, sim_pasc y sim_text.
$ sim_c *.c
$ sim_text texto1.txt texto2.txt