# IMDb-LatinFace IMDb-LatinFace es una base de imágenes de rostros de celebridades procedentes de IMDb. Las celebridades fueron seleccionadas a partir de su lugar de nacimiento, específicamente un país de latinoamérica. ### Procedimiento La siguiente imagen muestra los pasos seguidos para generar el dataset.  ### Si se utiliza este dataset, por favor citar: @article{DiIelsi:21, <br> title={Base de Imágenes Latinoamericana para Reconocimiento Facial}, <br> author={Di Ielsi, C., and Negri, P.}, <br> journal={50 Jornadas Argentinas de Informática (JAIIO), Simposio de Argentino de Imágenes y Visión}, <br> year={2021} <br> } <br> ### Descarga - Los archivos de cada país, contiendo los links a la fotografía original y la metadata se puede descargar de este [link](https://drive.google.com/file/d/1UQ91PiBMnlCt9z3jyrWIgui3LyCRU2Ux/view?usp=sharing). - El dataset de rostros ya extraídos se puede descargar deste este [link] (https://drive.google.com/file/d/1N9mpNw5J5FMZvOr7KruUXWTTKU5TxJ9z/view?usp=share_link). - Descomprimir el archivo **IMDb-Latam-FaceDataset.zip**. ### Estadísticos de la Base de Imágenes El dataset contiene 20 paises de latinoamérica (por orden alfabético): - Argentina - Bolivia - Brazil - Chile - Colombia - Costa Rica - Cuba - República Dominicana - Ecuador - El Salvador - Guatemala - Honduras - Mexico - Nicaragua - Panama - Paraguay - Peru - Puerto Rico - Uruguay - Venezuela El archivo zip contiene una carpeta por país. Dentro de cada carpeta se encuentra la siguiente estructura de directorios y archivos: ``` Argentina | -> celeb_img | -> 0001903 | -> crop_000_48.jpg crop_001_72.jpg crop_005_72.jpg ... crop_020_None.jpg ... -> 0002199 | -> ... ... Bolivia ... ``` En este ejemplo se muestra que dentro de cada folder 'celeb_img' se separan las identidades de las celebridades utilizando su IMDb ID. Luego, dentro de este folder, se puede encontrar un código identificatorio del roi y la edad obtenida de la fotografía. Por ejemplo, la primera corresponde a una edad de 48 años, las dos siguientes a 72 años, y en el crop 020 no había información de edad, con lo que se agregó el texto 'None'. El total de identidades diferentes es de 1.469 y de 36.658 fotografías de rostros. ## Contacto ``` [Pablo Negri](pnegri [at] gmail.com) ``` ## Disclaimer If you are the celebrity included in the list and you do not want to be included in the dataset, please contact us and we will remove the data based on your request.