Implementación de fotomosaicos

Introducción

Un fotomosaico es una imagen dividida en una cuadrícula de rectángulos, cada uno reemplazado por otra imagen que coincide con el objetivo (la imagen que finalmente desea que aparezca en el fotomosaico). En otras palabras, si miras un fotomosaico desde la distancia, ves la imagen de destino; pero si te acercas, verás que la imagen en realidad consta de muchas imágenes más pequeñas. Esto funciona debido a cómo funciona el ojo humano.

Hay dos tipos de mosaico, dependiendo de cómo se haga el emparejamiento. En un tipo más simple, cada parte de la imagen de destino se promedia hasta un solo color. Cada una de las imágenes de la biblioteca también se reduce a un solo color. Luego, cada parte de la imagen de destino se reemplaza con una de la biblioteca donde estos colores son lo más similares posible. En efecto, se reduce la resolución de la imagen de destino (por disminución de la resolución), y luego cada uno de los píxeles resultantes se reemplaza con una imagen cuyo color promedio coincide con ese píxel.

En el tipo más avanzado de mosaico fotográfico, la imagen de destino no se reduce y la coincidencia se realiza comparando cada píxel del rectángulo con el píxel correspondiente de cada imagen de la biblioteca. Luego, el rectángulo en el objetivo se reemplaza con la imagen de la biblioteca que minimiza la diferencia total. Esto requiere mucho más cálculo que el tipo simple, pero los resultados pueden ser mucho mejores ya que la coincidencia píxel por píxel puede preservar la resolución de la imagen de destino.

¿Cómo crear fotomosaicos? 

  1. Lea las imágenes de los mosaicos, que reemplazarán los mosaicos en la imagen original.
  2. Lea la imagen de destino y divídala en una cuadrícula M×N de mosaicos.
  3. Para cada mosaico, encuentre la mejor coincidencia de las imágenes de entrada.
  4. Cree el mosaico final organizando las imágenes de entrada seleccionadas en una cuadrícula M×N.

Dividir las imágenes en mosaicos

Ahora veamos cómo calcular las coordenadas para un solo mosaico de esta cuadrícula. El mosaico con índice (i, j) tiene una coordenada en la esquina superior izquierda de (i*w, i*j) y una coordenada en la esquina inferior derecha de ((i+1)*w, (j+1)*h ), donde w y h representan el ancho y la altura de un mosaico, respectivamente. Estos se pueden usar con el PIL para recortar y crear un mosaico a partir de esta imagen.
Promedio de valores de color
Cada píxel de una imagen tiene un color que se puede representar mediante sus valores de rojo, verde y azul. En este caso, está utilizando imágenes de 8 bits, por lo que cada uno de estos componentes tiene un valor de 8 bits en el rango [0, 255]. Dada una imagen con un total de N píxeles, el RGB promedio se calcula de la siguiente manera:
\left ( r,g,b \right )_{avg}=\left ( \frac{\left ( r_{1} + r_{2} +....+ r_{N} \right )}{N}, \frac{\left ( g_{1} + g_{2} +....+ g_{N} \right )}{N}, \frac{\left ( b_{1} + b_{2} +....+ b_{N} \right )}{N} \right )
Imágenes coincidentes
Para cada mosaico en la imagen de destino, debe encontrar una imagen coincidente de las imágenes en la carpeta de entrada especificada por el usuario. Para determinar si dos imágenes coinciden, use los valores RGB promedio. La coincidencia más cercana es la imagen con el valor RGB promedio más cercano. 
La forma más sencilla de hacer esto es calcular la distancia entre los valores RGB en un píxel para encontrar la mejor coincidencia entre las imágenes de entrada. Puede usar el siguiente cálculo de distancia para puntos 3D de la geometría:
D_{1, 2}=\sqrt{\left ( r_{1} - r_{2} \right )^{2} + \left ( g_{1} - g_{2} \right )^{2} + \left ( b_{1} - b_{2} \right )^{2}}
Ahora intentemos codificar esto

Python3

#Importing the required libraries
import os, random, argparse
from PIL import Image
import imghdr
import numpy as np
 
def getAverageRGBOld(image):
  """
  Given PIL Image, return average value of color as (r, g, b)
  """
  # no. of pixels in image
  npixels = image.size[0]*image.size[1]
  # get colors as [(cnt1, (r1, g1, b1)), ...]
  cols = image.getcolors(npixels)
  # get [(c1*r1, c1*g1, c1*g2),...]
  sumRGB = [(x[0]*x[1][0], x[0]*x[1][1], x[0]*x[1][2]) for x in cols]
  # calculate (sum(ci*ri)/np, sum(ci*gi)/np, sum(ci*bi)/np)
  # the zip gives us [(c1*r1, c2*r2, ..), (c1*g1, c1*g2,...)...]
  avg = tuple([int(sum(x)/npixels) for x in zip(*sumRGB)])
  return avg
 
def getAverageRGB(image):
  """
  Given PIL Image, return average value of color as (r, g, b)
  """
  # get image as numpy array
  im = np.array(image)
  # get shape
  w,h,d = im.shape
  # get average
  return tuple(np.average(im.reshape(w*h, d), axis=0))
 
def splitImage(image, size):
  """
  Given Image and dims (rows, cols) returns an m*n list of Images
  """
  W, H = image.size[0], image.size[1]
  m, n = size
  w, h = int(W/n), int(H/m)
  # image list
  imgs = []
  # generate list of dimensions
  for j in range(m):
    for i in range(n):
      # append cropped image
      imgs.append(image.crop((i*w, j*h, (i+1)*w, (j+1)*h)))
  return imgs
 
def getImages(imageDir):
  """
  given a directory of images, return a list of Images
  """
  files = os.listdir(imageDir)
  images = []
  for file in files:
    filePath = os.path.abspath(os.path.join(imageDir, file))
    try:
      # explicit load so we don't run into resource crunch
      fp = open(filePath, "rb")
      im = Image.open(fp)
      images.append(im)
      # force loading image data from file
      im.load()
      # close the file
      fp.close()
    except:
      # skip
      print("Invalid image: %s" % (filePath,))
  return images
 
def getImageFilenames(imageDir):
  """
  given a directory of images, return a list of Image file names
  """
  files = os.listdir(imageDir)
  filenames = []
  for file in files:
    filePath = os.path.abspath(os.path.join(imageDir, file))
    try:
      imgType = imghdr.what(filePath)
      if imgType:
        filenames.append(filePath)
    except:
      # skip
      print("Invalid image: %s" % (filePath,))
  return filenames
 
def getBestMatchIndex(input_avg, avgs):
  """
  return index of best Image match based on RGB value distance
  """
 
  # input image average
  avg = input_avg
   
  # get the closest RGB value to input, based on x/y/z distance
  index = 0
  min_index = 0
  min_dist = float("inf")
  for val in avgs:
    dist = ((val[0] - avg[0])*(val[0] - avg[0]) +
            (val[1] - avg[1])*(val[1] - avg[1]) +
            (val[2] - avg[2])*(val[2] - avg[2]))
    if dist < min_dist:
      min_dist = dist
      min_index = index
    index += 1
 
  return min_index
 
 
def createImageGrid(images, dims):
  """
  Given a list of images and a grid size (m, n), create
  a grid of images.
  """
  m, n = dims
 
  # sanity check
  assert m*n == len(images)
 
  # get max height and width of images
  # ie, not assuming they are all equal
  width = max([img.size[0] for img in images])
  height = max([img.size[1] for img in images])
 
  # create output image
  grid_img = Image.new('RGB', (n*width, m*height))
   
  # paste images
  for index in range(len(images)):
    row = int(index/n)
    col = index - n*row
    grid_img.paste(images[index], (col*width, row*height))
     
  return grid_img
 
 
def createPhotomosaic(target_image, input_images, grid_size,
                      reuse_images=True):
  """
  Creates photomosaic given target and input images.
  """
 
  print('splitting input image...')
  # split target image
  target_images = splitImage(target_image, grid_size)
 
  print('finding image matches...')
  # for each target image, pick one from input
  output_images = []
  # for user feedback
  count = 0
  batch_size = int(len(target_images)/10)
 
  # calculate input image averages
  avgs = []
  for img in input_images:
    avgs.append(getAverageRGB(img))
 
  for img in target_images:
    # target sub-image average
    avg = getAverageRGB(img)
    # find match index
    match_index = getBestMatchIndex(avg, avgs)
    output_images.append(input_images[match_index])
    # user feedback
    if count > 0 and batch_size > 10 and count % batch_size is 0:
      print('processed %d of %d...' %(count, len(target_images)))
    count += 1
    # remove selected image from input if flag set
    if not reuse_images:
      input_images.remove(match)
 
  print('creating mosaic...')
  # draw mosaic to image
  mosaic_image = createImageGrid(output_images, grid_size)
 
  # return mosaic
  return mosaic_image
 
# Gather our code in a main() function
def main():
  # Command line args are in sys.argv[1], sys.argv[2] ..
  # sys.argv[0] is the script name itself and can be ignored
 
  # parse arguments
  parser = argparse.ArgumentParser
    (description='Creates a photomosaic from input images')
  # add arguments
  parser.add_argument('--target-image', dest='target_image', required=True)
  parser.add_argument('--input-folder', dest='input_folder', required=True)
  parser.add_argument('--grid-size', nargs=2, dest='grid_size', required=True)
  parser.add_argument('--output-file', dest='outfile', required=False)
 
  args = parser.parse_args()
 
  ###### INPUTS ######
 
  # target image
  target_image = Image.open(args.target_image)
 
  # input images
  print('reading input folder...')
  input_images = getImages(args.input_folder)
 
  # check if any valid input images found 
  if input_images == []:
      print('No input images found in %s. Exiting.' % (args.input_folder, ))
      exit()
 
  # shuffle list - to get a more varied output?
  random.shuffle(input_images)
 
  # size of grid
  grid_size = (int(args.grid_size[0]), int(args.grid_size[1]))
 
  # output
  output_filename = 'mosaic.png'
  if args.outfile:
    output_filename = args.outfile
   
  # re-use any image in input
  reuse_images = True
 
  # resize the input to fit original image size?
  resize_input = True
 
  ##### END INPUTS #####
 
  print('starting photomosaic creation...')
   
  # if images can't be reused, ensure m*n <= num_of_images
  if not reuse_images:
    if grid_size[0]*grid_size[1] > len(input_images):
      print('grid size less than number of images')
      exit()
   
  # resizing input
  if resize_input:
    print('resizing images...')
    # for given grid size, compute max dims w,h of tiles
    dims = (int(target_image.size[0]/grid_size[1]),
            int(target_image.size[1]/grid_size[0]))
    print("max tile dims: %s" % (dims,))
    # resize
    for img in input_images:
      img.thumbnail(dims)
 
  # create photomosaic
  mosaic_image = createPhotomosaic(target_image, input_images, grid_size,
                                   reuse_images)
 
  # write out mosaic
  mosaic_image.save(output_filename, 'PNG')
 
  print("saved output to %s" % (output_filename,))
  print('done.')
 
# Standard boilerplate to call the main() function to begin
# the program.
if __name__ == '__main__':
  main()
python test.py --target-image test-data/a.jpg --input-folder test-data/set1/ --grid-size 128 128

Producción:

Enlaces de referencia:
1) Python Playground por Mahesh Venkitachalam. 
2) Documentos de PILLOW 
3) Wikipedia – Photomosaics
Este artículo es una contribución de Subhajit Saha . Si te gusta GeeksforGeeks y te gustaría contribuir, también puedes escribir un artículo usando write.geeksforgeeks.org o enviar tu artículo por correo a review-team@geeksforgeeks.org. Vea su artículo que aparece en la página principal de GeeksforGeeks y ayude a otros Geeks.
Escriba comentarios si encuentra algo incorrecto o si desea compartir más información sobre el tema tratado anteriormente.

Publicación traducida automáticamente

Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *