Introducción
Un fotomosaico es una imagen dividida en una cuadrícula de rectángulos, cada uno reemplazado por otra imagen que coincide con el objetivo (la imagen que finalmente desea que aparezca en el fotomosaico). En otras palabras, si miras un fotomosaico desde la distancia, ves la imagen de destino; pero si te acercas, verás que la imagen en realidad consta de muchas imágenes más pequeñas. Esto funciona debido a cómo funciona el ojo humano.
Hay dos tipos de mosaico, dependiendo de cómo se haga el emparejamiento. En un tipo más simple, cada parte de la imagen de destino se promedia hasta un solo color. Cada una de las imágenes de la biblioteca también se reduce a un solo color. Luego, cada parte de la imagen de destino se reemplaza con una de la biblioteca donde estos colores son lo más similares posible. En efecto, se reduce la resolución de la imagen de destino (por disminución de la resolución), y luego cada uno de los píxeles resultantes se reemplaza con una imagen cuyo color promedio coincide con ese píxel.
En el tipo más avanzado de mosaico fotográfico, la imagen de destino no se reduce y la coincidencia se realiza comparando cada píxel del rectángulo con el píxel correspondiente de cada imagen de la biblioteca. Luego, el rectángulo en el objetivo se reemplaza con la imagen de la biblioteca que minimiza la diferencia total. Esto requiere mucho más cálculo que el tipo simple, pero los resultados pueden ser mucho mejores ya que la coincidencia píxel por píxel puede preservar la resolución de la imagen de destino.
¿Cómo crear fotomosaicos?
- Lea las imágenes de los mosaicos, que reemplazarán los mosaicos en la imagen original.
- Lea la imagen de destino y divídala en una cuadrícula M×N de mosaicos.
- Para cada mosaico, encuentre la mejor coincidencia de las imágenes de entrada.
- Cree el mosaico final organizando las imágenes de entrada seleccionadas en una cuadrícula M×N.
Dividir las imágenes en mosaicos
Ahora veamos cómo calcular las coordenadas para un solo mosaico de esta cuadrícula. El mosaico con índice (i, j) tiene una coordenada en la esquina superior izquierda de (i*w, i*j) y una coordenada en la esquina inferior derecha de ((i+1)*w, (j+1)*h ), donde w y h representan el ancho y la altura de un mosaico, respectivamente. Estos se pueden usar con el PIL para recortar y crear un mosaico a partir de esta imagen.
Promedio de valores de color
Cada píxel de una imagen tiene un color que se puede representar mediante sus valores de rojo, verde y azul. En este caso, está utilizando imágenes de 8 bits, por lo que cada uno de estos componentes tiene un valor de 8 bits en el rango [0, 255]. Dada una imagen con un total de N píxeles, el RGB promedio se calcula de la siguiente manera:
Imágenes coincidentes
Para cada mosaico en la imagen de destino, debe encontrar una imagen coincidente de las imágenes en la carpeta de entrada especificada por el usuario. Para determinar si dos imágenes coinciden, use los valores RGB promedio. La coincidencia más cercana es la imagen con el valor RGB promedio más cercano.
La forma más sencilla de hacer esto es calcular la distancia entre los valores RGB en un píxel para encontrar la mejor coincidencia entre las imágenes de entrada. Puede usar el siguiente cálculo de distancia para puntos 3D de la geometría:
Ahora intentemos codificar esto
Python3
#Importing the required libraries import os, random, argparse from PIL import Image import imghdr import numpy as np def getAverageRGBOld(image): """ Given PIL Image, return average value of color as (r, g, b) """ # no. of pixels in image npixels = image.size[0]*image.size[1] # get colors as [(cnt1, (r1, g1, b1)), ...] cols = image.getcolors(npixels) # get [(c1*r1, c1*g1, c1*g2),...] sumRGB = [(x[0]*x[1][0], x[0]*x[1][1], x[0]*x[1][2]) for x in cols] # calculate (sum(ci*ri)/np, sum(ci*gi)/np, sum(ci*bi)/np) # the zip gives us [(c1*r1, c2*r2, ..), (c1*g1, c1*g2,...)...] avg = tuple([int(sum(x)/npixels) for x in zip(*sumRGB)]) return avg def getAverageRGB(image): """ Given PIL Image, return average value of color as (r, g, b) """ # get image as numpy array im = np.array(image) # get shape w,h,d = im.shape # get average return tuple(np.average(im.reshape(w*h, d), axis=0)) def splitImage(image, size): """ Given Image and dims (rows, cols) returns an m*n list of Images """ W, H = image.size[0], image.size[1] m, n = size w, h = int(W/n), int(H/m) # image list imgs = [] # generate list of dimensions for j in range(m): for i in range(n): # append cropped image imgs.append(image.crop((i*w, j*h, (i+1)*w, (j+1)*h))) return imgs def getImages(imageDir): """ given a directory of images, return a list of Images """ files = os.listdir(imageDir) images = [] for file in files: filePath = os.path.abspath(os.path.join(imageDir, file)) try: # explicit load so we don't run into resource crunch fp = open(filePath, "rb") im = Image.open(fp) images.append(im) # force loading image data from file im.load() # close the file fp.close() except: # skip print("Invalid image: %s" % (filePath,)) return images def getImageFilenames(imageDir): """ given a directory of images, return a list of Image file names """ files = os.listdir(imageDir) filenames = [] for file in files: filePath = os.path.abspath(os.path.join(imageDir, file)) try: imgType = imghdr.what(filePath) if imgType: filenames.append(filePath) except: # skip print("Invalid image: %s" % (filePath,)) return filenames def getBestMatchIndex(input_avg, avgs): """ return index of best Image match based on RGB value distance """ # input image average avg = input_avg # get the closest RGB value to input, based on x/y/z distance index = 0 min_index = 0 min_dist = float("inf") for val in avgs: dist = ((val[0] - avg[0])*(val[0] - avg[0]) + (val[1] - avg[1])*(val[1] - avg[1]) + (val[2] - avg[2])*(val[2] - avg[2])) if dist < min_dist: min_dist = dist min_index = index index += 1 return min_index def createImageGrid(images, dims): """ Given a list of images and a grid size (m, n), create a grid of images. """ m, n = dims # sanity check assert m*n == len(images) # get max height and width of images # ie, not assuming they are all equal width = max([img.size[0] for img in images]) height = max([img.size[1] for img in images]) # create output image grid_img = Image.new('RGB', (n*width, m*height)) # paste images for index in range(len(images)): row = int(index/n) col = index - n*row grid_img.paste(images[index], (col*width, row*height)) return grid_img def createPhotomosaic(target_image, input_images, grid_size, reuse_images=True): """ Creates photomosaic given target and input images. """ print('splitting input image...') # split target image target_images = splitImage(target_image, grid_size) print('finding image matches...') # for each target image, pick one from input output_images = [] # for user feedback count = 0 batch_size = int(len(target_images)/10) # calculate input image averages avgs = [] for img in input_images: avgs.append(getAverageRGB(img)) for img in target_images: # target sub-image average avg = getAverageRGB(img) # find match index match_index = getBestMatchIndex(avg, avgs) output_images.append(input_images[match_index]) # user feedback if count > 0 and batch_size > 10 and count % batch_size is 0: print('processed %d of %d...' %(count, len(target_images))) count += 1 # remove selected image from input if flag set if not reuse_images: input_images.remove(match) print('creating mosaic...') # draw mosaic to image mosaic_image = createImageGrid(output_images, grid_size) # return mosaic return mosaic_image # Gather our code in a main() function def main(): # Command line args are in sys.argv[1], sys.argv[2] .. # sys.argv[0] is the script name itself and can be ignored # parse arguments parser = argparse.ArgumentParser (description='Creates a photomosaic from input images') # add arguments parser.add_argument('--target-image', dest='target_image', required=True) parser.add_argument('--input-folder', dest='input_folder', required=True) parser.add_argument('--grid-size', nargs=2, dest='grid_size', required=True) parser.add_argument('--output-file', dest='outfile', required=False) args = parser.parse_args() ###### INPUTS ###### # target image target_image = Image.open(args.target_image) # input images print('reading input folder...') input_images = getImages(args.input_folder) # check if any valid input images found if input_images == []: print('No input images found in %s. Exiting.' % (args.input_folder, )) exit() # shuffle list - to get a more varied output? random.shuffle(input_images) # size of grid grid_size = (int(args.grid_size[0]), int(args.grid_size[1])) # output output_filename = 'mosaic.png' if args.outfile: output_filename = args.outfile # re-use any image in input reuse_images = True # resize the input to fit original image size? resize_input = True ##### END INPUTS ##### print('starting photomosaic creation...') # if images can't be reused, ensure m*n <= num_of_images if not reuse_images: if grid_size[0]*grid_size[1] > len(input_images): print('grid size less than number of images') exit() # resizing input if resize_input: print('resizing images...') # for given grid size, compute max dims w,h of tiles dims = (int(target_image.size[0]/grid_size[1]), int(target_image.size[1]/grid_size[0])) print("max tile dims: %s" % (dims,)) # resize for img in input_images: img.thumbnail(dims) # create photomosaic mosaic_image = createPhotomosaic(target_image, input_images, grid_size, reuse_images) # write out mosaic mosaic_image.save(output_filename, 'PNG') print("saved output to %s" % (output_filename,)) print('done.') # Standard boilerplate to call the main() function to begin # the program. if __name__ == '__main__': main()
python test.py --target-image test-data/a.jpg --input-folder test-data/set1/ --grid-size 128 128
Producción:
Enlaces de referencia:
1) Python Playground por Mahesh Venkitachalam.
2) Documentos de PILLOW
3) Wikipedia – Photomosaics
Este artículo es una contribución de Subhajit Saha . Si te gusta GeeksforGeeks y te gustaría contribuir, también puedes escribir un artículo usando write.geeksforgeeks.org o enviar tu artículo por correo a review-team@geeksforgeeks.org. Vea su artículo que aparece en la página principal de GeeksforGeeks y ayude a otros Geeks.
Escriba comentarios si encuentra algo incorrecto o si desea compartir más información sobre el tema tratado anteriormente.
Publicación traducida automáticamente
Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA