Не могу понять, почему у выходного файла идет смещение и ухудшение качества картинки?

Question

Leroi_1 @Leroi_1

C++
ARM

Не могу понять, почему у выходного файла идет смещение и ухудшение качества картинки?

Я сейчас учусь и пишу код на С++, разбираюсь с АРМ Неон, а у меня вылезло 2 неприятные ситуации. 1) Начало съезжать изображение, а почему не понимаю, вроде бы как все дела правильно, а код все равно берет и переносит часть изображения. 2) Работая без АРМ'а у меня вышел хороший четкий файл, а тут все никак не выходит сделать отличный результат. Либо изображение выходит размытым, либо очень резким.

Сам код:

#include <arm_neon.h>
#include <vector>
#include <algorithm>
#include <cstdint>
#include <iostream>
#include <fstream>
#include <chrono>

// Функция для чтения 8-битного BMP файла
std::vector<uint8_t> readBMP(const std::string &filename, int &width, int &height) {
    std::ifstream file(filename, std::ios::binary);
    if (!file) {
        std::cerr << "Ошибка: не удалось открыть файл " << filename << std::endl;
        return {};
    }

    // Чтение заголовка BMP
    uint8_t header[54];
    file.read(reinterpret_cast<char*>(header), 54);

    // Извлечение ширины и высоты изображения
    width = *reinterpret_cast<int*>(&header[18]);
    height = *reinterpret_cast<int*>(&header[22]);

    // Извлечение данных изображения
    int size = width * height;
    std::vector<uint8_t> data(size);
    file.read(reinterpret_cast<char*>(data.data()), size);

    return data;
}

// Функция для записи 8-битного BMP файла
void writeBMP(const std::string &filename, const std::vector<uint8_t> &data, int width, int height) {
    std::ofstream file(filename, std::ios::binary);
    if (!file) {
        std::cerr << "Ошибка: не удалось создать файл " << filename << std::endl;
        return;
    }

    // Создание заголовка BMP
    uint8_t header[54] = {
        0x42, 0x4D, 0, 0, 0, 0, 0, 0, 0, 0, 0x36, 0x04, 0, 0, 40, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 8, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
    };

    int fileSize = 54 + 255 * 4 + width * height;
    header[2] = fileSize;
    header[3] = fileSize >> 8;
    header[4] = fileSize >> 16;
    header[5] = fileSize >> 24;

    header[18] = width;
    header[19] = width >> 8;
    header[20] = width >> 16;
    header[21] = width >> 24;

    header[22] = height;
    header[23] = height >> 8;
    header[24] = height >> 16;
    header[25] = height >> 24;

    file.write(reinterpret_cast<char*>(header), 54);

    // Запись цветовой палитры (256 цветов)
    for (int i = 0; i < 256; ++i) {
        uint8_t color[4] = { static_cast<uint8_t>(i), static_cast<uint8_t>(i), static_cast<uint8_t>(i), 0 };
        file.write(reinterpret_cast<char*>(color), 4);
    }

    // Запись данных изображения
    file.write(reinterpret_cast<const char*>(data.data()), data.size());
}

// Функция свёртки с использованием ARM NEON
std::vector<uint8_t> convolve_neon(const std::vector<uint8_t> &input, int width, int height) {
    std::vector<int32_t> intermediate_output(width * height, 0);
    std::vector<uint8_t> output(width * height, 0);
    const int8_t filter[25] = {
        1, 1, 1, 1, 1,
        1, 1, 1, 1, 1,
        0, 0, 0, 0, 0,
       -1,-1,-1,-1,-1,
       -1,-1,-1,-1,-1
    };

    // Загружаем фильтр в NEON регистры
    int8x16_t filter_low = vld1q_s8(filter);      // Загружаем первые 16 элементов
    int8x16_t filter_high = vld1q_s8(filter + 9); // Загружаем последние 16 элементов с перекрытием

    // Проходим по всем пикселям изображения
    for (int y = 0; y < height; ++y) {
        for (int x = 0; x < width; ++x) {
            int32x4_t sum = vdupq_n_s32(0);

            // Проходим по окну свёртки
            for (int fy = -2; fy <= 2; ++fy) {
                for (int fx = -2; fx <= 2; ++fx) {
                    int ix = x + fx;
                    int iy = y + fy;
                    // Проверяем границы изображения
                    if (ix >= 0 && ix < width && iy >= 0 && iy < height) {
                        // Загружаем пиксель
                        uint8x8_t pixel = vld1_u8(&input[iy * width + ix]);
                        // Преобразуем в int8x8_t для выполнения операций
                        int8x8_t pixel_signed = vreinterpret_s8_u8(pixel);

                        // Выбираем соответствующий регистр фильтра
                        int8x16_t filter_val = fx < 0 ? filter_low : filter_high;

                        // Умножаем пиксели на значения фильтра
                        int16x8_t result = vmull_s8(pixel_signed, vget_low_s8(filter_val));

                        // Преобразуем результат в сумму
                        int32x4_t temp = vpaddlq_s16(result);
                        sum = vaddq_s32(sum, temp);
                    }
                }
            }

            // Сохраняем промежуточный результат
            intermediate_output[y * width + x] = vgetq_lane_s32(sum, 0);
        }
    }

    // Нормализация значений
    int32_t max_val = *std::max_element(intermediate_output.begin(), intermediate_output.end());
    int32_t min_val = *std::min_element(intermediate_output.begin(), intermediate_output.end());
    for (size_t i = 0; i < output.size(); ++i) {
        output[i] = static_cast<uint8_t>(255.0 * (intermediate_output[i] - min_val) / (max_val - min_val));
    }

    return output;
}

int main() {
    int width, height;
    std::vector<uint8_t> image = readBMP("Scene384/0100.bmp", width, height);
    if (image.empty()) {
        return -1;
    }

    // Замер времени выполнения свёртки
    auto start = std::chrono::high_resolution_clock::now();
    std::vector<uint8_t> output = convolve_neon(image, width, height);
    auto end = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double> duration = end - start;

    writeBMP("ARMOUT_0100.bmp", output, width, height);

    std::cout << "Обработка завершена. Результат сохранён в ARMOUT_0100.bmp" << std::endl;
    std::cout << "Время выполнения свёртки: " << duration.count() << " секунд" << std::endl;

    return 0;
}

Вопрос задан более года назад
133 просмотра

1 комментарий

Подписаться 1 Средний 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Разработчик на C++: Профессия + специализация + нейросети

12 месяцев

Далее
Skillbox

Разработчик на C++

7 месяцев

Далее
Яндекс Практикум

Разработчик C++

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

5 комментариев

Leroi_1 @Leroi_1 Автор вопроса

Я умножения на 8 почистил, но не понимаю, как избавиться от циклов от -2 до 2.
Качество изображения стало лучше!

#include <arm_neon.h>
#include <vector>
#include <fstream>
#include <stdexcept>
#include <chrono>
#include <iostream>
#include <opencv2/core.hpp>
#include <opencv2/imgcodecs.hpp>
#include <opencv2/imgproc.hpp>
#include <cstdint>

namespace bmp {

// Перечисление для поддержки различных форматов заголовков BMP
enum class InfoHeaderFormats {
    InfoHeader
    // Другие форматы могут быть добавлены здесь
};

// Класс для работы с BMP-файлами
template <InfoHeaderFormats T>
class BMPFileUserDefined {
public:
    // Конструктор
    BMPFileUserDefined() {}

    // Метод для чтения BMP-файла
    void read_bmp(const std::string& filename, int& width, int& height, std::vector<uint8_t>& pixelData) {
        std::ifstream file(filename, std::ios::binary);
        if (!file) {
            throw std::runtime_error("Не удалось открыть файл для чтения");
        }

        // Здесь должен быть код для чтения заголовка BMP-файла и заполнения переменных width, height и pixelData

        // Пример чтения данных (заглушка)
        width = 384; // Пример ширины
        height = 384; // Пример высоты
        pixelData.resize(width * height);
        file.read(reinterpret_cast<char*>(pixelData.data()), pixelData.size());

        if (!file) {
            throw std::runtime_error("Ошибка при чтении файла");
        }
    }

    // Метод для создания BMP-файла
    void create_bmp(const std::string& filename, int width, int height, const uint8_t* data) {
        std::ofstream file(filename, std::ios::binary);
        if (!file) {
            throw std::runtime_error("Не удалось открыть файл для записи");
        }

        // Здесь должен быть код для записи заголовка BMP-файла

        // Запись пиксельных данных
        file.write(reinterpret_cast<const char*>(data), width * height);

        if (!file.good()) {
            throw std::runtime_error("Ошибка при записи файла");
        }
    }

    // Деструктор
    ~BMPFileUserDefined() {}

private:
    // Частные методы и члены класса
};

} // namespace bmp

// Функция для изменения размера изображения
void resizeImage(cv::Mat &image) {
    // Устанавливаем новый размер в два раза больше исходного
    cv::Size newSize(image.cols * 2, image.rows * 2);
    cv::Mat resizedImage;

    // Изменяем размер изображения
    cv::resize(image, resizedImage, newSize, 0, 0, cv::INTER_LINEAR);

    // Обновляем исходное изображение
    image = resizedImage;
}

// Функция свёртки с использованием NEON интринсиков
void convolve_neon(const uint8_t* input, int width, int height, uint8_t* output) {
    // Определяем фильтр свёртки
    const int8_t kernel[25] = {
        1, 1, 1, 1, 1,
        1, 1, 1, 1, 1,
        0, 0, 0, 0, 0,
        -1,-1,-1,-1,-1,
        -1,-1,-1,-1,-1
    };

    // Пример реализации свёртки с использованием NEON интринсиков
    
    // Предполагается, что input и output выровнены по 16 байт
    for (int y = 2; y < height - 2; ++y) {
        for (int x = 2; x < width - 2; ++x) {
            int32x4_t sum = vdupq_n_s32(0);

            for (int ky = -2; ky <= 2; ++ky) {
                for (int kx = -2; ++kx) {
                    // Получаем значение пикселя и ядра
                    int pixel_value = input[(y + ky) * width + (x + kx)];
                    int kernel_value = kernel[(ky + 2) * 5 + (kx + 2)];

                    // Умножаем и добавляем к сумме
                    sum = vmlaq_n_s32(sum, vdupq_n_s32(pixel_value), kernel_value);
                }
            }

            // Сохраняем результат в выходном массиве
            int32_t result = vgetq_lane_s32(vaddq_s32(sum, vdupq_n_s32(128)), 0);
            output[y * width + x] = static_cast<uint8_t>(std::max(0, std::min(255, result)));
        }
    }
}

// Функция для применения фильтра Гаусса
void applyGaussianBlur(cv::Mat &image) {
    // Размытие Гаусса с ядром 5x5
    cv::GaussianBlur(image, image, cv::Size(5, 5), 0);
}

// Функция для применения порогового фильтра
void applyThreshold(cv::Mat &image) {
    // Пороговая обработка
    cv::threshold(image, image, 255, 255, cv::THRESH_BINARY);
}

// Функция для обнаружения краев с помощью оператора Собеля
void detectEdgesSobel(cv::Mat &image) {
    cv::Mat grad_x, grad_y;
    cv::Mat abs_grad_x, abs_grad_y;

    // Вычисление производных по X и Y
    cv::Sobel(image, grad_x, CV_16S, 1, 0, 3);
    cv::Sobel(image, grad_y, CV_16S, 0, 1, 3);

    // Преобразование в абсолютные значения
    cv::convertScaleAbs(grad_x, abs_grad_x);
    cv::convertScaleAbs(grad_y, abs_grad_y);

    // Объединение градиентов
    cv::addWeighted(abs_grad_x, 0.5, abs_grad_y, 0.5, 0, image);
}

int main() {
    try {
        // Используем класс BMPFileUserDefined для чтения BMP-файла
        bmp::BMPFileUserDefined<bmp::InfoHeaderFormats::InfoHeader> bmpFile;
        std::vector<uint8_t> pixelData;
        int width, height;
        bmpFile.read_bmp("Scene384/0100.bmp", width, height, pixelData);

        // Проверяем, что данные изображения загружены корректно
        if (pixelData.empty()) {
            throw std::runtime_error("Ошибка: данные изображения не загружены");
        }

        // Преобразуем пиксельные данные в объект cv::Mat
        cv::Mat image(height, width, CV_8UC1, pixelData.data());

        // Проверяем, что объект cv::Mat инициализирован корректно
        if (image.empty()) {
            throw std::runtime_error("Ошибка: объект cv::Mat не инициализирован");
        }

        // Применяем функции обработки изображений
        resizeImage(image);
        applyGaussianBlur(image);
        applyThreshold(image);
        detectEdgesSobel(image);

        // После обработки преобразуем данные обратно и сохраняем BMP-файл
        bmpFile.create_bmp("res_arm.bmp", image.cols, image.rows, image.data);

        // Выводим сообщение об успешном сохранении файла
        std::cout << "Файл успешно сохранен как res_arm.bmp" << std::endl;
    } catch (const std::exception &e) {
        std::cerr << "Error: " << e.what() << std::endl;
        return 1;
    }

    return 0;
}

Написано более года назад

Wataru @wataru Куратор тега C++

Leroi_1, Самое простое - по строкам. Надо исходное изображение расширить хотя бы на 7 байт в конце, чтобы не было чтения за границей массива, а ваше ядро добить тремя 0 до ширины в 8 байт.

Потом вы для каждой из 5 строк вы загружаете в регистр строку ядра и строку исходного изображения (всегда на 2 пикселя левее). Векторно их перемножаете, суммируете и эти 5 чисел складываете в ответ. У вас на самом деле загрузятся еще 3 лишних значения правее - это будут или пиксели со следующей строки, или вообще нули в самом конце массива. Но тут нет проблемы, ибо в ядре там стоят 0 и они умножатся на 0.

Тут вы 25 операций векторизовали пятерками. Это работает легче всего, потому что данные лежат вот так по строкам. если вы попытаетесь 4 раза по 8, или 2 по 16 элеменов как-то загружать сразу, у вас все будет очень сложно и скорее всего даже медленнее.

Тут, правда, будет проблема с первыми двумя столбцами изображения - у вас же нет никаких пикселей левее.

Для обработки этого случая, вам придется загружать Input не с позиции на 2 пикселя левее, а на 1 или 0, но тогда и kernel придется читать со столбца 1/2 а не 0.

Для обработки крайних строк надо будет пропускать какие-то из этих 5 итераций цикла.

Или сильно проще будет, если в при загрузке изображения поместите его в рамочку из нулей шириной 2. Т.е. у вас будет +4 толбца и +4 строки.

Написано более года назад
Leroi_1 @Leroi_1 Автор вопроса

Wataru, Я со вчерашнего дня сижу и не совсем понимаю, где именно ты имеешь ввиду "исходное изображение расширить хотя бы на 7 байт в конце, чтобы не было чтения за границей массива, а ваше ядро добить тремя 0 до ширины в 8 байт." Качество самой картинки, в принципе, меня устраивает, но не смещение остается. Для понимания прикреплю вводное и выводное изображения. (Черное вводное)

Написано более года назад
Wataru @wataru Куратор тега C++

Leroi_1, У тебя изображение - одномерный массив. При чтении любого пикселя - прочитается 8 байт. Т.е. если ты попытаешься прочесть последний пиксель - 7 лишних байт за массивом прочитаются. Надо сделать массив на 7 байт больше. Ядро будет матрицей 5x8, вроде {1,1,1,1,1,0,0,0} ...{-1,-1,-1,-1,-1,0,0,0}} Потому что векторыне операции выполняются с 8 байтами сразу.

Написано более года назад
Leroi_1 @Leroi_1 Автор вопроса

Wataru, Сделал, как ты сказал, но ничего не поменялось

Написано более года назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

Простой
Какой контейнер выбрать для поиска по ключу для разных размеров?
- 2 подписчика
- 14 дек.
- 128 просмотров
0

ответов
C++

+2 ещё

Простой
Как прочитать данные из пайпа в C++ не перепутав с TTY stdin?
- 1 подписчик
- 14 дек.
- 76 просмотров
1

ответ
C++

Простой
Почему function wrapper с ссылкой в сигнатуре может принимать pointer to member function?
- 1 подписчик
- 11 дек.
- 68 просмотров
0

ответов
C++

Простой
Как лучше реализовать асинхронную задержку?
- 2 подписчика
- 04 дек.
- 209 просмотров
2

ответа
C++

+2 ещё

Простой
Как скомпилировать рабочую dll библиотеку?
- 3 подписчика
- 26 нояб.
- 328 просмотров
1

ответ
C++

+1 ещё

Простой
Как узнать, хранятся числа в компьютере в прямом, дополнительном или обратном коде?
- 1 подписчик
- 23 нояб.
- 470 просмотров
6

ответов
C++

+1 ещё

Средний
Имя массива это адрес первого элемента или указатель на его первый элемент в Си?
- 2 подписчика
- 12 нояб.
- 483 просмотра
5

ответов
C++

+1 ещё

Простой
Почему Project Dependencies не работает?
- 1 подписчик
- 10 нояб.
- 100 просмотров
1

ответ
C++

Простой
Влияет ли, передаёшь ты в функцию аргументы по ссылке или по значению, на производительность и память?
- 2 подписчика
- 07 нояб.
- 362 просмотра
2

ответа
Linux

+4 ещё

Простой
Не видно курсор в KDE, что делать?
- 1 подписчик
- 07 нояб.
- 224 просмотра
1

ответ
Показать ещё Загружается…

Web Designer (Иллюстратор)

Peppermint

от 1 600 до 2 000 $

Project менеджер / Менеджер проекта

W3Promo • Москва

от 60 000 до 100 000 ₽

Backend разработчик (Rust)

Street Falcon • Москва

от 250 000 ₽

Попробуй сравнить 2 bmp файла и посмотри на каком байте есть разница.

Answer 1 · 2024-07-12 15:31:28

Потому что у вас неправильно применяется векторизация к задаче. У вас там свертка с ядром 5x5. Т.е. для одного выходного пикселя вы должны сделать 25 умножений и их сложить. Вы же делаете 25*8 уможений для каждого пикселя. Потом как-то странно их еще и суммируете.

Если у вас уж есть векторизация, то вы какие операции распаралеливаете? Вот эти 25 умножений же, правда? Значит у вас в программе не должно быть вообще вот этих циклов от -2 до 2. Вы эти операции сначала развернули в 25 отдельных, а потом их по 5 или 8 штук объединили в одну векторную операцию.

Не могу понять, почему у выходного файла идет смещение и ухудшение качества картинки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт