31 mayo, 2023 carloscorredor34 BLOG, IA Modelo RCNN Intoduccion: En el fascinante campo de la visión por computadora, los investigadores y científicos han estado desarrollando constantemente nuevas técnicas para identificar y comprender el contenido visual de imágenes y videos. Uno de los avances más destacados en este ámbito es el Modelo de Red Convolutiva Regional (RCNN, por sus siglas en inglés), que ha revolucionado la tarea de detección y clasificación de objetos. En esta entrada de blog, exploraremos qué es exactamente el modelo RCNN y cómo se ha convertido en una herramienta poderosa para resolver desafíos de reconocimiento de objetos en imágenes. ¿Que es un modelo RCNN?: El modelo RCNN es un enfoque innovador que combina la detección y clasificación de objetos en un solo sistema coherente y eficiente. Su arquitectura se basa en redes neuronales convolucionales profundas (CNN) y ha demostrado un rendimiento sobresaliente en la detección precisa y la clasificación de objetos en imágenes. La idea principal detrás del modelo RCNN es dividir el problema de detección y clasificación en dos etapas distintas pero interconectadas. Objetivo final de este post: Como objetivo final tendremos un notebook en colab donde se encontrara un modelo RCNN, entrenado para detectar vehiculos (principalmente motos y carros) y a su vez detectar la etiqueta especifica.Objetivos especificos:Redimencionamiento del dataset a (350,350,3)Generar un archivo .json para el etiquetado (Este ya vendra incluido en el google Drive).Data augmentationCreacion del modelo RCNN para deteccion de boundingbox y prediccion de etiquetas.Un enlace de dockerfile para testear el modelo y otros mas.Una vez cumplidos estos objetivos encontrara en el notebook el codigo fuente para la creacion y entrenamiento del modelo. Como crear un modelo RCNN con keras: Determinar un objetivo: Para iniciar debemos colocarnos un objetivo para proceder a crear las etiquetas; en este caso como se menciono en la seccion de objetivos final crearemos un modelo para deteccion de vehiculos con dos etiquetas motos y carros. 2. Preparacion de las imagenes: Para este caso debemos redimencionar las imagenes a un tamaño especifico dado que en el dataset cada imagen -que son 42 en total – tiene dimenciones diferentes; en este caso la dimencion sera de (350,350,3). 3. Creacion de bounding box y etiquetado: para este caso usaremos una herramienta web para la creacion de etiquetas y bounding box esta es: linkedai.“Nota: para la creacion de bounding box y label se debe especificar un limite o numero de detecciones maximas en este caso son 5“.Esto nos generara un archivo .json, el cual contendra los datos de las posicion del bounding box y las etiquetas especificadas. 4. Crecion del modelo RCNN: Para este caso se creara un modelo RCNN con entrada de una imagen de (350,350,3) una imagen jpg de toda la vida.Como capas ocultas (hidden layers) hay un las tipicas capas presentes en un modelo CNN, con esto nos referimos a capas de convolucion,maxpooling, la capa de vectorizacion (flatten) y capas densas (donde estas se separaran en dos, una con una funcion de activacion del tipo softmax para el area de prediccion de etiquetas y la otra con una funcion de tipo linear).Y por ultimo como capa de salida tenemos dos salidas ambas del tipo reshape de (5,4) para el bounding box -donde el 5 es el limite de predicciones y el 4 hace referencia a el ‘Y’ minimo y maximo asi como el ‘X’ minimo y maximo-.Y por otro lado el reshape con (5,2) -donde el dos es la cantidad de etiquetas existentes (carros y motos)-. Como usar el contenedor de docker: En este caso contamos con un contenedor montado en docker hub, en caso de querer usarlos haz click en el siguiente enlce y crea un documento de docker-compose.yml con base a la infomacion suministrada en el enlace de coekr hub¿Que hay dentro del contenedor?Dentro del contenedor hay un aplicacion flask que se ejecuta en el puerto 5000 donde hay dos modelos de IA el primero un modelo de segmentacion y el segundo el modelo que mencionamos y que hacemos referencia en el colab.Enlace del docker hub: https://hub.docker.com/repository/docker/ccorredor21/lectormodelos/general Ver codigo en github Ver código en Colab Leer post en ingles
Leave a Reply Cancelar respuesta Guardar mi nombre, correo electrónico y sitio web en este navegador para la próxima vez que haga un comentario. Δ