src/utils/quant_levels_utils.c

*b2055c35SXin Li// Copyright 2011 Google Inc. All Rights Reserved.
*b2055c35SXin Li//
*b2055c35SXin Li// Use of this source code is governed by a BSD-style license
*b2055c35SXin Li// that can be found in the COPYING file in the root of the source
*b2055c35SXin Li// tree. An additional intellectual property rights grant can be found
*b2055c35SXin Li// in the file PATENTS. All contributing project authors may
*b2055c35SXin Li// be found in the AUTHORS file in the root of the source tree.
*b2055c35SXin Li// -----------------------------------------------------------------------------
*b2055c35SXin Li//
*b2055c35SXin Li// Quantize levels for specified number of quantization-levels ([2, 256]).
*b2055c35SXin Li// Min and max values are preserved (usual 0 and 255 for alpha plane).
*b2055c35SXin Li//
*b2055c35SXin Li// Author: Skal ([email protected])
*b2055c35SXin Li
*b2055c35SXin Li#include <assert.h>
*b2055c35SXin Li
*b2055c35SXin Li#include "src/utils/quant_levels_utils.h"
*b2055c35SXin Li
*b2055c35SXin Li#define NUM_SYMBOLS     256
*b2055c35SXin Li
*b2055c35SXin Li#define MAX_ITER  6             // Maximum number of convergence steps.
*b2055c35SXin Li#define ERROR_THRESHOLD 1e-4    // MSE stopping criterion.
*b2055c35SXin Li
*b2055c35SXin Li// -----------------------------------------------------------------------------
*b2055c35SXin Li// Quantize levels.
*b2055c35SXin Li
*b2055c35SXin Liint QuantizeLevels(uint8_t* const data, int width, int height,
*b2055c35SXin Li                   int num_levels, uint64_t* const sse) {
*b2055c35SXin Li  int freq[NUM_SYMBOLS] = { 0 };
*b2055c35SXin Li  int q_level[NUM_SYMBOLS] = { 0 };
*b2055c35SXin Li  double inv_q_level[NUM_SYMBOLS] = { 0 };
*b2055c35SXin Li  int min_s = 255, max_s = 0;
*b2055c35SXin Li  const size_t data_size = height * width;
*b2055c35SXin Li  int i, num_levels_in, iter;
*b2055c35SXin Li  double last_err = 1.e38, err = 0.;
*b2055c35SXin Li  const double err_threshold = ERROR_THRESHOLD * data_size;
*b2055c35SXin Li
*b2055c35SXin Li  if (data == NULL) {
*b2055c35SXin Li    return 0;
*b2055c35SXin Li  }
*b2055c35SXin Li
*b2055c35SXin Li  if (width <= 0 || height <= 0) {
*b2055c35SXin Li    return 0;
*b2055c35SXin Li  }
*b2055c35SXin Li
*b2055c35SXin Li  if (num_levels < 2 || num_levels > 256) {
*b2055c35SXin Li    return 0;
*b2055c35SXin Li  }
*b2055c35SXin Li
*b2055c35SXin Li  {
*b2055c35SXin Li    size_t n;
*b2055c35SXin Li    num_levels_in = 0;
*b2055c35SXin Li    for (n = 0; n < data_size; ++n) {
*b2055c35SXin Li      num_levels_in += (freq[data[n]] == 0);
*b2055c35SXin Li      if (min_s > data[n]) min_s = data[n];
*b2055c35SXin Li      if (max_s < data[n]) max_s = data[n];
*b2055c35SXin Li      ++freq[data[n]];
*b2055c35SXin Li    }
*b2055c35SXin Li  }
*b2055c35SXin Li
*b2055c35SXin Li  if (num_levels_in <= num_levels) goto End;  // nothing to do!
*b2055c35SXin Li
*b2055c35SXin Li  // Start with uniformly spread centroids.
*b2055c35SXin Li  for (i = 0; i < num_levels; ++i) {
*b2055c35SXin Li    inv_q_level[i] = min_s + (double)(max_s - min_s) * i / (num_levels - 1);
*b2055c35SXin Li  }
*b2055c35SXin Li
*b2055c35SXin Li  // Fixed values. Won't be changed.
*b2055c35SXin Li  q_level[min_s] = 0;
*b2055c35SXin Li  q_level[max_s] = num_levels - 1;
*b2055c35SXin Li  assert(inv_q_level[0] == min_s);
*b2055c35SXin Li  assert(inv_q_level[num_levels - 1] == max_s);
*b2055c35SXin Li
*b2055c35SXin Li  // k-Means iterations.
*b2055c35SXin Li  for (iter = 0; iter < MAX_ITER; ++iter) {
*b2055c35SXin Li    double q_sum[NUM_SYMBOLS] = { 0 };
*b2055c35SXin Li    double q_count[NUM_SYMBOLS] = { 0 };
*b2055c35SXin Li    int s, slot = 0;
*b2055c35SXin Li
*b2055c35SXin Li    // Assign classes to representatives.
*b2055c35SXin Li    for (s = min_s; s <= max_s; ++s) {
*b2055c35SXin Li      // Keep track of the nearest neighbour 'slot'
*b2055c35SXin Li      while (slot < num_levels - 1 &&
*b2055c35SXin Li             2 * s > inv_q_level[slot] + inv_q_level[slot + 1]) {
*b2055c35SXin Li        ++slot;
*b2055c35SXin Li      }
*b2055c35SXin Li      if (freq[s] > 0) {
*b2055c35SXin Li        q_sum[slot] += s * freq[s];
*b2055c35SXin Li        q_count[slot] += freq[s];
*b2055c35SXin Li      }
*b2055c35SXin Li      q_level[s] = slot;
*b2055c35SXin Li    }
*b2055c35SXin Li
*b2055c35SXin Li    // Assign new representatives to classes.
*b2055c35SXin Li    if (num_levels > 2) {
*b2055c35SXin Li      for (slot = 1; slot < num_levels - 1; ++slot) {
*b2055c35SXin Li        const double count = q_count[slot];
*b2055c35SXin Li        if (count > 0.) {
*b2055c35SXin Li          inv_q_level[slot] = q_sum[slot] / count;
*b2055c35SXin Li        }
*b2055c35SXin Li      }
*b2055c35SXin Li    }
*b2055c35SXin Li
*b2055c35SXin Li    // Compute convergence error.
*b2055c35SXin Li    err = 0.;
*b2055c35SXin Li    for (s = min_s; s <= max_s; ++s) {
*b2055c35SXin Li      const double error = s - inv_q_level[q_level[s]];
*b2055c35SXin Li      err += freq[s] * error * error;
*b2055c35SXin Li    }
*b2055c35SXin Li
*b2055c35SXin Li    // Check for convergence: we stop as soon as the error is no
*b2055c35SXin Li    // longer improving.
*b2055c35SXin Li    if (last_err - err < err_threshold) break;
*b2055c35SXin Li    last_err = err;
*b2055c35SXin Li  }
*b2055c35SXin Li
*b2055c35SXin Li  // Remap the alpha plane to quantized values.
*b2055c35SXin Li  {
*b2055c35SXin Li    // double->int rounding operation can be costly, so we do it
*b2055c35SXin Li    // once for all before remapping. We also perform the data[] -> slot
*b2055c35SXin Li    // mapping, while at it (avoid one indirection in the final loop).
*b2055c35SXin Li    uint8_t map[NUM_SYMBOLS];
*b2055c35SXin Li    int s;
*b2055c35SXin Li    size_t n;
*b2055c35SXin Li    for (s = min_s; s <= max_s; ++s) {
*b2055c35SXin Li      const int slot = q_level[s];
*b2055c35SXin Li      map[s] = (uint8_t)(inv_q_level[slot] + .5);
*b2055c35SXin Li    }
*b2055c35SXin Li    // Final pass.
*b2055c35SXin Li    for (n = 0; n < data_size; ++n) {
*b2055c35SXin Li      data[n] = map[data[n]];
*b2055c35SXin Li    }
*b2055c35SXin Li  }
*b2055c35SXin Li End:
*b2055c35SXin Li  // Store sum of squared error if needed.
*b2055c35SXin Li  if (sse != NULL) *sse = (uint64_t)err;
*b2055c35SXin Li
*b2055c35SXin Li  return 1;
*b2055c35SXin Li}
*b2055c35SXin Li