En este artículo, vamos a ver cómo hacer una cuadrícula de imágenes en PyTorch. podemos hacer una grilla de imágenes usando la función make_grid() del paquete torchvision.utils.
función make_grid():
La función make_grid() acepta tensor 4D con forma [B, C, H, W]. donde B representa el tamaño del lote, C representa el número de canales y H, W representa la altura y el ancho respectivamente. La altura y el peso deben ser los mismos para todas las imágenes. Esta función devuelve el tensor que contiene una cuadrícula de imágenes de entrada. también podemos establecer la cantidad de imágenes que se muestran en cada fila usando el parámetro nrow . La siguiente sintaxis se usa para crear una cuadrícula de imágenes en PyTorch.
Sintaxis: torchvision.utils.make_grid(tensor)
Parámetro:
- tensor (Tensor o lista ) tensor de forma (B x C x H x W) o una lista de imágenes todas del mismo tamaño.
- nrow ( int , opcional): número de imágenes que se muestran en cada fila de la cuadrícula. Predeterminado: 8.
- relleno ( int , opcional) – cantidad de relleno. Predeterminado: 2.
Devoluciones: esta función devuelve el tensor que contiene una cuadrícula de imágenes de entrada.
Ejemplo 1:
El siguiente ejemplo es para entender cómo hacer una grilla de imágenes en PyTorch.
Python3
# import required library import torch import torchvision from torchvision.io import read_image from torchvision.utils import make_grid # read images from computer a = read_image('a.jpg') b = read_image('b.jpg') c = read_image('c.jpg') d = read_image('d.jpg') # make grid from the input images # this grid contain 4 columns and 1 row Grid = make_grid([a, b, c, d]) # display result img = torchvision.transforms.ToPILImage()(Grid) img.show()
Producción:
Ejemplo 2:
en el siguiente ejemplo, creamos una cuadrícula de imágenes y establecemos la cantidad de imágenes que se muestran en cada fila usando el parámetro nrow .
Python3
# import required library import torch import torchvision from torchvision.io import read_image from torchvision.utils import make_grid # read images from computer a = read_image('a.jpg') b = read_image('b.jpg') c = read_image('c.jpg') d = read_image('d.jpg') e = read_image('e.jpg') f = read_image('f.jpg') # make grid from the input images # this grid contain 2 rows and 3 columns Grid = make_grid([a, b, c, d, e, f], nrow=3) # display result img = torchvision.transforms.ToPILImage()(Grid) img.show()
Producción:
Ejemplo 3:
En el siguiente ejemplo, creamos una cuadrícula de imágenes y establecemos el relleno entre las imágenes.
Python3
# import required library import torch import torchvision from torchvision.io import read_image from torchvision.utils import make_grid # read images from computer a = read_image('a.png') b = read_image('b.png') c = read_image('c.png') d = read_image('d.png') e = read_image('e.png') f = read_image('f.png') # make grid from the input images # set nrow=3, and padding=25 Grid = make_grid([a, b, c, d, e, f], nrow=3, padding=25) # display result img = torchvision.transforms.ToPILImage()(Grid) img.show()
Producción:
Publicación traducida automáticamente
Artículo escrito por mukulsomukesh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA