Как настроить нейронную сеть на python?

Question

MisCam @MisCam

OpenCV
NumPy

Как настроить нейронную сеть на python?

Есть следующий код на Python (используются библиотеки numpy и OpenCV), так же у меня есть по 100 фотографий котов и собак в папках для обучения. Я достаю фото из функции load_images, складывая их в общий массив. По итогу получаю массив из 200 фотографий размера IMG_SIZE на IMG_SIZE пикселей, где каждый элемент - яркость пикселя от 0 до 1, тоесть фотографии достаются верно. Посмотрев кучу видосов на эту тему, я нашёл алгоритм для прямого распространения и обратного, однако ничего из этого не было заточено под фотографии.
СУТЬ ПРОБЛЕМЫ: На выходе из forward (прямого распространения) я ожидаю увидеть число от 0 до 1, которое означает вероятность того, собака это или кошка. Однако у меня на выходе всегда одно и то же число, а именно 0.05. Проблема в том, что оно всегда такое, неважно, какие веса и смещения я беру, оно не меняется, хотя должно, в этом и суть программы (веса и смещения с каждым запуском новое)
Возможные полезные данные: output_hidden_layer_sum выдаёт мне матрицу 100 на 2, формата
[
[842.23323, 728.932],
[592.25123, 582.232],
...
[392.1233, 369.231],
[203/23, 240.2312],
]
Меня смущают немного такие большие числа, с учётом того, что изначально было от 0 до 1 матрица, и матрица, где числа не превышали 10, но полагаю я всё сделал правильно.
Надеюсь на вашу помощь, уже 2 дня парюсь, заранее спасибо

import numpy as np
import cv2
import os

IMG_SIZE = 100
learning_rate = 0.1
# Задаем размеры слоев
input_layer_size = IMG_SIZE
hidden_layer_size = IMG_SIZE * 2
output_layer_size = 2
# Задаём веса и смещения
W1 = np.random.rand(input_layer_size, hidden_layer_size)
B1 = np.random.rand(hidden_layer_size)

W2 = np.random.rand(hidden_layer_size, output_layer_size)
B2 = np.random.rand(output_layer_size)

def load_images():
    images = []
    labels = []
    cat_folder_path = os.path.join('pets', 'cat')
    dog_folder_path = os.path.join('pets', 'dog')

    def get_images(path, answer):
        for i in range(100):
            file_path = os.path.join(path, f'{i}.jpg')
            image = cv2.imread(file_path)
            image = cv2.resize(image, (IMG_SIZE, IMG_SIZE))
            image = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)
            image = image / 255.0
            images.append(image)
            labels.append(answer)

    get_images(cat_folder_path, 1)
    get_images(dog_folder_path, 0)

    return np.array(images), np.array(labels)

def relu(x):
    return np.maximum(x, 0)


def softmax(x):
    x = normalize(x)
    exp_x = np.exp(x)
    res = exp_x / np.sum(exp_x)
    return res

def normalize(x):
    x_norm = np.linalg.norm(x)
    x_normalized = x / x_norm
    return x_normalized

def forward(image):
    hidden_layer_sum = image @ W1 + B1
    activated_hidden_layer = relu(hidden_layer_sum)
    output_hidden_layer_sum = activated_hidden_layer @ W2 + B2
    result = softmax(output_hidden_layer_sum)
    return np.mean(result)

def train(image, answer, num_epochs):
    y_pred = forward(image)
    print(y_pred)

images, answers = load_images()
train(images[0], answers[0], 1)

Вопрос задан более двух лет назад
146 просмотров

3 комментария

Подписаться 1 Средний 3 комментария

freeExec @freeExec

Так тут нет обратного хода распространения ошибки, которая меняла бы веса. Нету никакого обучения. Что же до больших значений, то relu не нормализует выход, поэтому верхней границы значений нет.

Написано более двух лет назад
MisCam @MisCam Автор вопроса

freeExec, Проблема в том, что я пишу прогу поблочно, сейчас я пытаюсь реализовать прямое распространение, мне не нужно пока думать об обучении, сейчас есть проблема - веса меняются, а вероятность - нет. Так же я нормализую результаты в самом начале функции softmax

Написано более двух лет назад
Модератор @TosterModerator

Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента. Также обратите внимание на п.3.4

Написано более двух лет назад

Пригласить эксперта

Ответы на вопрос 2

4 комментария

MisCam @MisCam Автор вопроса

На выходе из softmax я ожидаю увидеть вероятность, однако я получаю вероятности послойно (короче у меня же матрица 50 на 50 условно, так вот массив из 50 вероятностей, как я понял, там послойно разделено), поэтому я их объединяю в одну среднюю вероятность, если брать argmax, то он вообще выдаёт 7 или 6. (а про оператор @ я сам недавно узнал, до этого пользовался np.dot, но разницы нет, а запись короче и понятнее)

Написано более двух лет назад
Vindicar @Vindicar

MisCam, ну вот это странно. На выходе ты должен получить простой вектор из двух элементов.
Если подаёшь на вход сразу всю выборку, то тогда будет матрица Nx2.
У тебя как выглядят веса для этого вектора?

Написано более двух лет назад
MisCam @MisCam Автор вопроса

Вес W1 - матрица 50 на 100 (в моём случае), выглядит она примерно как на скрине, но я там сделал меньший размер картинки, что бы глаза не опухли от размера весов и смещений (но указывать буду как по факту должно работать)
Смещение B1 - 1 на 100
Вес W2 - 100 на 2
Смещение B2 - 1 на 2
На скрине числа такие же, как и в реальной программе, тоесть небольшие (но всегда рандомные)

На выходе
hidden_layer_sum = image @ W1 + B1
hidden_layer_sum - матрица 50 на 100, числа около 2-20
activated_hidden_layer = relu(hidden_layer_sum)
activated_hidden_layer - не особо что-то меняется, размерность та же
output_hidden_layer_sum = activated_hidden_layer @ W2 + B2
output_hidden_layer_sum - матрица 50 на 2 (числа большие, указывал в самом начале)
result - это матрица 50 на 2, где числа от 0.045 до 0.065

Написано более двух лет назад
fenrir @fenrir1121

Vindicar он еще в 3.5 появился в качестве скалярного произведения PEP 465, но за пределами numpy его особо и не увидишь

Написано более двух лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Средний
Нужно дополнить код в Python. Как добавить значения к цветам или выделить контуры более детально с прикреплением значений?
- 2 подписчика
- 20 мая
- 444 просмотра
0

ответов
Windows

+4 ещё

Средний
Почему эмуляция кликов мыши через SendInput блокируется после трёх срабатываний?
- 1 подписчик
- 05 мар.
- 363 просмотра
1

ответ
OpenCV

Простой
Как сделать поиск объектов на скриншоте из игры?
- 1 подписчик
- 04 февр.
- 138 просмотров
3

ответа
NumPy

+1 ещё

Средний
Можно ли через numpy или pandas удалить строки в многомерном массиве, элементы которого содержат два и более разных значений?
- 1 подписчик
- 28 янв.
- 120 просмотров
1

ответ
OpenCV

Средний
Как реализовать алгоритм заливки в openCV python, как в фотошопе?
- 1 подписчик
- 25 дек. 2024
- 73 просмотра
0

ответов
OpenCV

Простой
Почему при записи видео через opencv файл выходит испорченным?
- 1 подписчик
- 19 дек. 2024
- 73 просмотра
0

ответов
NumPy

Простой
Как разобраться в задании лабораторной работы?
- 1 подписчик
- 16 дек. 2024
- 164 просмотра
3

ответа
C#

+2 ещё

Средний
Возможно ли отобразить окно openCV на python в окне WPF c#?
- 1 подписчик
- 04 дек. 2024
- 111 просмотров
1

ответ
Нейронные сети

+2 ещё

Простой
Методы для поиска объектов на изображениях?
- 3 подписчика
- 25 нояб. 2024
- 789 просмотров
1

ответ
Python

+1 ещё

Средний
Как определить координаты совпадающих фигур?
- 1 подписчик
- 21 нояб. 2024
- 112 просмотров
2

ответа
Показать ещё Загружается…

Разработчик CV

БИОРГ • Москва

от 140 000 ₽

C++ Разработчик

Desert Power Designs • Дубай

от 4 000 до 5 000 $

Frontend AI разработчик

Asphera Technologies

от 60 000 ₽

Так тут нет обратного хода распространения ошибки, которая меняла бы веса. Нету никакого обучения. Что же до больших значений, то relu не нормализует выход, поэтому верхней границы значений нет.
freeExec, Проблема в том, что я пишу прогу поблочно, сейчас я пытаюсь реализовать прямое распространение, мне не нужно пока думать об обучении, сейчас есть проблема - веса меняются, а вероятность - нет. Так же я нормализую результаты в самом начале функции softmax
Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента. Также обратите внимание на п.3.4

Answer 1 · 2023-03-19 16:33:35

Почему ты делаешь np.mean(result)?
Если я верно помню, softmax-слой даст наибольший отклик в элементе, соответствующем выбранному классу. Т.е. нужно сделать argmax по этому слою, чтобы узнать ответ сети.

P.S.: обалдеть, я и не знал что в питоне есть оператор @.

Answer 2 · 2023-03-19 17:21:34

Александр Скуснов @AlexSku

не буду отвечать из-за модератора

Попробуйте примеры PyTorch, мне кажется, там понятнее.

Ответ написан более двух лет назад

Комментировать

Как настроить нейронную сеть на python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт