Primeras experiencias en competencias Kaggle

Comparto otras experiencias de mis alumnos en las competencias Kaggle, la idea es empezar a introducirse en lo que es el mundo del Machine Learning y el Data science, más que nada para saber de que tratan. Se trata de un examen para la materia Inteligencia Artificial del quinto año de las carreras de ingeniería en informática y electrónica.

El test consiste en crearse una cuenta de Kaggle, inscribirse a una competición en la que el desafío generalmente es aplicado algoritmos de ML con un dataset de entrenamiento, para crear justamente un modelo que pueda predecir los valores de una columna de otro dataset de test. El desafío consiste en utilizar los mejores algoritmos, funciones y técnicas disponibles para lograr el más alto porcentaje de predicción. En el camino se aprenden conceptos y herramientas para el área de la Ciencia de datos. Luego el alumno debe escribir un post contando su experiencia, en que kernel se basó, que puntaje obtuvo, etc.

En resumen considero que Kaggle es una buena opción para empezar a empaparse con el tema, tener una idea de que va la cosa y conocer los primeros principios, un buen punto de partida.

A continuación los artículos escritos por los alumnos contando su experiencia.

Vanesa Boggado: Google AI Open Images — Detección de objetos

Jonás Morínigo y Blanca Duarte: What’s Cooking?

Victor Ibarra y William Bustamante: House Prices: Advanced Regression Techniques

 

Impacto económico de las licencias educativas de software y servicios en la nube.

El presente trabajo ha sido presentado en el Workshop de Ing. en electricidad de la FCyT UNCA en mayo de 2017, en la feria ETyC Guairá en octubre del mismo año, en la feria anual del Ciberespacio organizada por el Bachiller técnico en informática del Colegio Nacional Pedro P. Peña(también en octubre del 2017) y está pendiente de aprobación para el I Congreso científico de la UNCA en setiembre del 2018.

Trata sobre el análisis del ahorro que pueden llegar a tener las instituciones educativas al obtener licencias y servicios de software y servidores virtuales gratuitamente. Toma como caso de ejemplo la Facultad de Ciencias y Tecnologías de la UNCA, donde se han gestionado licencias de GSuite, Autodesk, NUBE PY, entre otros.

Introducción

Actualmente varias grandes empresas que ofrecen software como servicio ofrecen licencias a precios reducidos o gratuitos para instituciones educativas, con el objetivo de promover su uso entre la comunidad educativa, en el presente estudio se pretende analizar cuantitativamente el ahorro potencial del uso de los servicios de software gestionados en la FCyT UNCA en el año 2017.

Metodología

Para hacer el cálculo se analiza cuánto costaría el uso de los distintos servicios de software en caso de tener que pagar las licencias para uso profesional u particular, y se multiplica este costo por la posible máxima cantidad de alumnos/docentes que pueden utilizar dichos servicios. Teniendo en cuenta la carrera estudiada, son distintos los software utilizados, y también existen algunos servicios que son utilizados por toda la comunidad, indistintamente de la carrera. En el trabajo se analizaron los software Autocad, Revit, map 3D, inventor de Autodesk, Gsuite de Google, Office365 de Microsoft, LucidPress y LucidChart de  Lucid Software Inc. , y los servicios de Servidor virtual y hosting proveídos por la SENATICS.

Resultados

Teniendo en cuenta que en el 2017 se registraron 538 alumnos, 118 docentes y 40 funcionarios, además de que se proveyeron 21 servidores virtuales para las distintas dependencias de la UNCA, el cálculo del ahorro potencial es de 3.701.148 USD en ese año.

 

Discusión

El máximo ahorro posible para la FCyT gracias a la gestión de servicios de software y máquinas virtuales logrados al ser una institución educativa triplica el presupuesto anual de la institución, sin embargo hace falta un estudio más profundo para analizar cuantos son los usuarios que realmente utilizan los servicios brindados, para obtener una estimación del ahorro real que se obtiene al utilizar dichos servicios en la institución.

 

Link al trabajo presentado

Participando en la competencia de Reconocimiento de dígitos en Kaggle

En la cohorte 2018 de la materia Inteligencia artificial en la Facultad de Ciencias y Tecnologías, Universidad Nacional de Caaguazú (FCyT UNCA) un examen consiste en participar de una competencia en la plataforma Kaggle, y escribir la experiencia, comparto lo relatado por los dos primeros estudiantes Pedro Fernandez y Cristhian Velazquez, en la cual terminaron utilizando la técnica GradientBoostingClassifier de la librería SK-learn:

Link al artículo en Medium

Control de asistencia a clases usando el reconocimiento facial de Google Photos

El presente trabajo ha sido presentado al Primer Congreso Científico de la UNCA en 2018, pendiente de aprobación.

Introducción

Google fotos es una de las opciones más usadas para almacenar en la nube fotografías y videos de manera automática a través de sus aplicaciones para los distintos sistemas operativos. Una de las opciones principales de este servicio es la de reconocimiento facial: en este trabajo se pretende analizar las posibilidades de este servicio para tomar asistencia de alumnos en una clase

Metodología

Se tomaron fotos de alumnos de una materia de la FCyT durante un semestre en el 2017 con la hipótesis de que si en cada foto el servicio reconoce correctamente todas las caras de los alumnos, esta será una opción viable para utilizarla en dicho fin, basta con subir una foto al servicio Fotos y tener activado el reconocimiento facial: automáticamente aparecen las caras de quienes están en la foto y se da la opción de identificar cada rostro identificado, ya sea escribiendo su nombre o seleccionándolo de los contactos. Luego simplemente copiando la lista de nombres reconocidos se tendría un registro de las personas que asistieron a la clase.

Resultados

En total al finalizar el semestre y utilizando una cuenta exclusiva para la prueba se logró en total un 87% de rostros reconocidos, de los cuales nuevamente el 94% fue correctamente reconocido.

Discusión

No se puede garantizar un funcionamiento 100% de esta técnica para controlar la asistencia a clases, debido a que hay varios factores relacionados a la misma que se deben ir mejorando: confusión de rostros parecidos, dificultad de tomar fotos en las que se vean bien todos los rostros en la menor cantidad de imágenes y la identificación no instantánea de los mismos serían los principales problemas para poder implementar ya como una solución esta herramienta para el fin buscado.

 

Link al artículo completo en MEDIUM

Sistema de Estadísticas Universitarias en Paraguay, comparación con los países vecinos

El presente trabajo es una investigación presentada como tesis en el marco de la Maestría en Gestión de la Educación Superior organizada por la Universidad Nacional de Caaguazú (UNCA) y fué defendido en octubre del 2017.

El trabajo también fué presentado en el Seminario Internacional de Gestión Universitaria organizado por la Facultad de Ciencias Económicas de dicha Universidad (FCE UNCA), llevado a cabo en agosto del 2018.

Los datos de los que se habla en el trabajo fueron tomados de fuentes públicas hasta el 2016.

Resumen

Actualmente no hay respuestas medianamente actualizadas y comprobadas u oficiales a preguntas simples referentes al sistema universitario nacional tales como por ejemplo cantidad de matriculados o egresados.

En este trabajo se propuso demostrar que implementando un sistema unificado de información universitaria para el Paraguay se puede mejorar significativamente la gestión universitaria, de manera a tener datos precisos y actualizados sobre todos los estamentos que componen la Universidad.

Para encarar este problema por un lado se buscó analizar el enfoque que tienen los países vecinos para responder a las mismas pregunta, y por otro lado se buscó llegar a una respuesta lo más real y actualizada posible utilizando fuentes públicas.

Como conclusión se pudo observar que la mejor manera de tener datos actualizados y reales es implementando sistemas unificados de información como lo demuestra Argentina y en menor medida Bolivia, en vez de recurrir a encuestas periódicas como lo hace Brasil o el mismo Paraguay, en donde la última de estas fue en 2011.

Además, se observa que utilizando el informe de gestión remitido por las universidades públicas al ministerio de hacienda anualmente, se pueden consolidar datos estadísticos acerca de las mismas, y eventualmente extrapolar esos datos hacia las universidades privadas para obtener un dato aproximado a nivel país.

Cabe destacar que ninguna metodología analizada en el trabajo brinda datos 100% seguros, debido a problemas que se van detallando en el análisis de cada caso.

 

Palabras clave: estadísticas, universidades, Paraguay, SIU, Nautilus, RUE, MEC, VES, CONES, ANEAES

Link al trabajo completo en Researchgate

Link al CV PY del autor del trabajo

Servidores de correo en distintas distribuciones de Linux

Los siguientes son trabajos presentados por los alumnos de la materia sistemas operativos 2, carrera ingeniería informática de la FCyT UNCA, año 2016, sobre configuración de servidores de correo en distintas distribuciones de Linux y también con Exchange 2013 de Microsoft.

Servidor de Correo con Postfix y Dovecot en Ubuntu 16.04 LTS.

Pedro Fernández y Cristian Velazquez.

Servidor de Correo con Postfix y Dovecot en Ubuntu 16.04 LTS

Ubuntu 16.04 LTS

Ubuntu 16.04 LTS

Resumen
Para configurar un servidor de correo en Ubuntu existe una gran variedad de alternativas, la opción más interesante es la utilización de Postfix y Dovecot, debido a sus grandes ventajas como la rapidez, facilidad de manejo y seguridad, además de ser software libre y de código abierto. Estos poseen una amplia compatibilidad con diferentes métodos de autenticación de usuarios, como la utilización de usuarios del sistema, base de datos en MySQL, archivos de contraseñas, entre otros. En este proyecto, se verá como configurar Postfix de tal manera que este se encargue de los correos salientes y le ceda a Dovecot la manipulación de la bandeja de entrada, la autenticación de usuarios y la recepción de los correos electrónicos, todo esto a través de usuarios virtuales, que se especificarán en la configuración de Postfix, configurando además el soporte para la autenticación basada en SSL/TLS y STARTTLS.

Instalación y Configuración de Exchange (Servidor de correo) en Windows Server,

Rodrigo E. Avalos Melgarejo y Victor R. Ibarra Benítez.

Instalación y Configuración de Exchange 2013 (Servidor de correo) en Windows Server

Microsoft Exchange 2013

Microsoft Exchange 2013

Resumen
La instalación de Microsoft Exchange 2013 esta dada por algunos pasos muy importantes en la cual los autores de este paper consideran son muy importantes para la utilizacion de dicho servidor de correo.Primeramente al terminar la instalacion de Windows server 2012 vamos a proceder a agregar los roles y caracteristricas a nuestro Windows server 2012 en el cual asignamos el nombre de nuestro dominio y el servidor,a continuacion vamos a instalar algunos pre requisitos previos que necesita Microsoft Exchange 2013 las cuales son el FilterPack64bit.exe ,filterpack2010sp1-kb2460041-x64-fullfile-es-es.exe y UcmaRuntimeSetup.exe , al terminar la instalacion de dichos pre requisitos ya podemos instalar Microsoft Exchange 2013 finalmente procedemos a crear a los usuarios que van a utilizar los servicios.

Servidor de Correo X Ubuntu.

Marcelo Abrahan Acuña Santander , Mario Manuel Moreno González

Servidor de Correo – XUbuntu – Sistemas Operativos-2n5p089

xubuntu

xubuntu

Resumen
Un servidor de correo es una aplicación informática ubicada en una página web en internet cuya función es parecida al Correo postal solo que en este caso los correos (otras veces llamados mensajes) que circulan, lo hacen a través de nuestras Redes de transmisión de datos y a diferencia del correo postal, por este medio solo se pueden enviar adjuntos de ficheros de cualquier extensión y no bultos o paquetes al viajar la información en formato electrónico.

Servidor de Correo: Exim4 + Courier + Roundcube en KUbuntu 14.04

Cabrera, Hugo; Mujica, Milko

Servidor de Correo: Exim4 + Courier + Roundcube en KUbuntu 14.04

Kubuntu 14.04

Kubuntu 14.04

Resumen
Un servidor de correo está compuesto por tres componentes: MUA (Agente Usuario de Correo), MTA (Agente de Transporte de Correo) y MDA (Agente de Entrega de Correo), en este trabajo serán configurados a base del video tutorial (Darmawan, 2014) con Exim4 como el MTA, Courier el MDA y Roundcube el MUA en un sistema operativo de KUbuntu 14.04. El protocolo SMTP (Protocolo Simple de Transferencia de Correo), estándar para la transferencia de correo entre servidores, será utilizado por Exim4 (MTA) y el protocolo para recuperar el correo electrónico de Courier (MDA) será IMAP (Protocolo de Acceso a Mensajes de Internet). El método de autenticación de usuarios y para el almacenamiento de los mensajes, será con la utilización de una base de datos en MySQL y los usuarios del sistema.

Servidor de Correo con Postfix y Dovecot en Zentyal 5.0

Acuña, Fany; Montania, Gricelda

Servidor de Correo con Postfix y Dovecot en Zentyal 5.0

zentyal

zentyal

Resumen
Zentyal dispone de un servicio integrado para las comunicaciones donde se pueden encontrar desde el típico correo electrónico hasta la posibilidad de mensaje instantánea. Cuenta con un conjunto muy fiable para poder manejar el volumen de información maliciosa o no deseada con la finalidad de mejorar el funcionamiento a nivel informático. Utiliza como MTA para el envío de correos Postfix. Así mismo, para el servicio de recepción de correos (POP3, IMAP) Zentyal usa Dovecot. Ambos con soporte para comunicación segura con SSL.

 

Servidor de Correo con Postfix y Dovecot en Debian 8.6

Duarte Torales, Blanca; Morinigo Bogado, Jonás

Servidor de Correo con Postfix y Dovecot en Debian 8.6

debian

debian

Resumen
La instalación de un Servidor de Correo en Debian 8.6 o cualquier otra distribución de Linux, requiere de diversos protocolos estándar y programas para su correcto funcionamiento, uno de los programas esenciales es el Servidor Web, el más utilizado es Apache2, el cual está diseñado para transferir datos de Hipertexto y ofrece soporte de seguridad SSL y TLS ; esta aplicación será utilizada para montar la aplicación Web-mail utilizada para gestionar el correo de nuestro servidor local; además de estos se utilizan los programas POSTFIX y DOVECOT, correspondientes a los protocolos estándar SMTP e IMAP, los cuales ayudaran al envío y recepción del servidor local y son compatibles con la mayoría de las aplicaciones de correo modernas.

Servidor de Correo openSUSE

Bogado Romero Vanessa, Cáceres Vera Ruth Verónica.

Servidor de Correo openSUSE

openSUSE

openSUSE

Resumen
Montar un servidor de correo electrónico a base de GNU/Linux y software libre está al alcance de cualquiera, pero mientras que para el usuario corriente no compensa el esfuerzo, en el ámbito de la empresa sí es una práctica extendida por razones de privacidad y control de la información.
Para montar un servidor de correo electrónico son imprescindibles diferentes elementos entre los que destaca el propio software que hará las veces de “mensajero”, lo que técnicamente se denomina como Mail Transfer Agent (MTA) o agente de transporte de correo en español.

Reblog: API IndexedDB de HTML5

La API de bajo nivel IndexedDB de HTML (recomendación del W3C a partir del 8 de enero del 2015) es un sistema de base de datos destinado a almacenar información indexada en el ordenador del usuario.
La estructura propuesta por IndexedDB es tam bién diferente de SQL u otros sistemas de base de datos
populares. La información es almacenada en la base de datos como objetos (registros) dentro de lo que es
llamado Almacenes de Objetos (tablas).
Cada registro consta de una clave y un valor. Por otra parte, la base de datos mantiene los índices sobre los registros que almacena. Un desarrollador de aplicaciones utiliza directamente una API para localizar registros ya sea por su clave o mediante el uso de un índice.
Para trabajar con objetos y Almacenes de Objetos solo necesitamos crear el Almacén de Objetos, declarar las
propiedades que serán usadas como índices y luego comenzar a almacenar objetos en este almacén.

Un sencillo ejemplo y su diferencia con la API LocalStorage: IndexedDB_localStorage-1tq5mj2

Fuente: JD Gauchat – HTML5 for masterminds, disponible en amazon

REblog de HE Blog

Instalar y configurar Samba en Xubuntu 16.04 LTS 64 bit

Actualizo esta entrada anterior sobre el mismo tema para Xubuntu 14.

Básicamente los pasos son los mismos con algunos pequeños cambios que hice solo para probar.

Primero: instalar samba: 

sudo apt-get install samba samba-common python-glade2 system-config-samba

Luego: renombrar el archivo por defecto smb.conf:

sudo mv /etc/samba/smb.conf /etc/samba/smb-old.conf

Configuramos el dominio (en este caso mi dominio lo llamé xubuntu.lan y donde hay espacios solo se presiona Enter, la IP es la del equipo): 

sudo samba-tool domain provision –use-rfc2307 –interactive

Realm: xubuntu.lan
Domain [xubuntu]:
Server Role (dc, member, standalone) [dc]:
DNS backend (SAMBA_INTERNAL, BIND9_FLATFILE, BIND9_DLZ, NONE) [SAMBA_INTERNAL]:
DNS forwarder IP address (write ‘none’ to disable forwarding) [127.0.1.1]: 10.0.2.15
Administrator password: (acá va un password fuerte)
Retype password: (y acá)

Luego, instalar y configurar kerberos:

sudo apt-get install krb5-user

reino: XUBUNTU.LAN

server (2 veces): EQUIPO.XUBUNTU.LAN

Siguiente paso: modificar el host:

sudo nano /etc/hosts

solo modificar la segunda linea de esta forma:

127.0.1.1       equipo.xubuntu.lan equipo

Siguiente paso, poner IP estática en el archivo interfaces:

sudo nano /etc/network/interfaces

agregamos al final:

 auto enp0s3 (este es el nombre de la interface)
iface enp0s3 inet static
address 10.0.2.15 (ip del equipo)
netmask 255.255.255.0
gateway 10.0.2.2 (ip de la puerta de enlace)
dns-nameserver 10.0.2.15 10.0.2.2 (equipo y puerta)
dns-search xubuntu.lan (nombre del dominio)

Luego reiniciamos con sudo reboot. 

Probamos el DNS:

host -t A vmrepository.xubuntu.lan (probamos el dominio)
vmrepository.xubuntu.lan has address 10.0.2.15 (debe responder algo así)

host -t SRV _ldap._tcp.xubuntu.lan (probamos el servidor)
_ldap._tcp.xubuntu.lan has SRV record 0 100 389 vmrepository.xubuntu.lan. (debe responder algo parecido)

finalmente probamos el kerberos:

kinit administrator

Password for administrator@XUBUNTU.LAN:  (metemos el password de administrator)
Warning: Your password will expire in 41 days on Thu 29 Dec 2016 09:40:38 PYST (algo así debería ser la respuesta)

Lo siguiente sería unir la pc cliente al dominio configurado.

  • En este caso no actualicé los binarios con apt-get update solo para ver si funcionaba, lo cual ocurrió.
  • El único cambio visible es la sintaxis para instalar samba, la cual varía de acuerdo a la fuente usada.

Adjunto este excelente material para Ubuntu 16.04 hecho por mis alumnos Pedro Fernández y Cristhian Velazquez: Samba en Ubuntu

Breve repaso a las Tics en la Educación Superior

Podemos comprender mejor el significado de las TIC analizando el significado palabra por palabra:

  • Tecnologías : aplicación de un conjunto de conocimientos y habilidades con el objetivo de conseguir una solución que permita al ser humano resolver un problema determinado
  • Información: conjunto organizado de datos procesados
  • Comunicación: actividad consciente de intercambiar información entre dos o más participantes.

Dicho de una manera simple TIC involucraría el hecho de comunicar información mediante la tecnología. Estas tecnologías abarcan desde computadoras, Smartphone, proyectores, pero por sobre todo lo que hizo que las Tics se popularicen ha sido el cada vez más fácil y estable acceso a Internet.

NUBE

Internet es la red más grande de computadoras y dispositivos conectada entre sí, básicamente podemos definirla como servidores (computadoras potentes)  ubicadas en distintos lugares del mundo y todas conectadas entre sí por cables o inalámbricamente.

Al tener un servicio de datos en internet, al usuario final de dicho servicio no le es relevante en donde esté ubicada la computadora que contiene estos datos, de ahí que siempre se dibuja a la internet como una nube: sabes que hay una nube y la misma nube puede dar sombra o lluvia a varias partes lejanas al mismo tiempo, pero donde está ubicada exactamente la nube no es relevante a la persona que se moja con la lluvia.

De ahí que hablar de “la nube” es hablar de servicios alojados en internet. Es una metáfora de internet. Obviamente para poder sacar el máximo provecho a estos servicios es tener una señal de internet bien estable, sin este requisito no hay ninguna utilidad para “la nube”.

Tics en la Educación

Es sabido en la arena educativa que uno de los factores fundamentales que ha permeado la utilización educacional de las tecnologías de información y comunicación (TICs) (Ilabaca, 2003)

Hablar del uso de las Tics en el aula actualmente ya no es una opción, es prácticamente una obligación y quien más o quien menos ya las implementa a nivel de docencia: ya sea usando un proyector para mostrar u PowerPoint, haciendo sus trabajos en Word, buscando información en internet, usando equipos de sonido o DVD para mostrar materiales interactivos, etc. Incluso se habla de la integración curricular de las Tics.

Son errores muy comunes en el uso de las TICS en el aula:

  • Proyectar textos largos y leerlos en clase, o hacerlos leer a los alumnos.
  • Usar mucho texto en el PowerPoint, o muchas imágenes.

En este sentido, la recomendación principal para PowerPoint es que sólo incluya títulos, ideas fuerza, imágenes y un uso limitado de notas como recordatorio. El PowerPoint es un programa que sirve como presentador de diapositivas, por tanto debería ser solo para material auxiliar, de manera a proyectarlo en clase como apoyo al trabajo del docente.

Así también para Word, lo recomendado es utilizarlo como material principal, en el cual se plasma el trabajo de investigación o redacción solicitado al alumno. Son buenas prácticas utilizar las herramientas que provee Word: portada, índice, títulos, notas al pie, citas bibliográficas, bibliografía.

Las herramientas como Word, PowerPoint, Excel forman parte de un conjunto de software denominados comúnmente como suite de ofimática. Existen varios productos de ofimática basados tanto en equipos (programas que se instalan) así como basados en la nube. En el caso de los mencionados, la empresa que los vende es Microsoft y el paquete de ofimática que los contiene se llama Office. Actualmente la versión más nueva es Office 365, que ya tiene una versión basada en la nube que es gratuita para docentes y alumnos con cuenta educativa.

Se puede mencionar además una serie de herramientas en la nube que podrían ser especialmente útiles para la docencia en Educación superior tales como: Google académico (buscador en publicaciones y revistas científicas indexadas) y Google ClassRoom(Aula virtual proveída por la empresa Google a instituciones educativas). Para usar esta última herramienta es necesario solicitar el servicio de Google Apps for Education que tiene como requisito también tener una cuenta educativa.

El uso de otras fuentes de información basada en la nube como Wikipedia, YouTube, redes sociales puede servir como orientación, pero no es recomendado su uso para investigaciones más serias, al ser sus fuentes poco fiables en la mayoría de los casos. Siempre debe haber un nombre que se pueda validar que firme los materiales que se usen como fuente.

Tener una cuenta educativa se refiere a, entre otras cosas, tener una página web activa con un dominio .edu o .edu.py para Paraguay. Este tipo de dominios está reservado para las instituciones de educación que demuestren serlo. No está en venta a particulares ni empresas que no sean del área.

Cualquiera sea la herramienta Tic utilizada en la clase, siempre debe tenerse en cuenta que estas son un apoyo para el docente, no un reemplazo del mismo. El docente siempre debe demostrar que está preparado para serlo y no suspender las clases por que no hay proyector, por dar un ejemplo, aunque es muy útil no se puede depender completamente de dicha herramienta ni de ninguna otra.

Link al Trabajo completo