Что подавать на вход нейронке?

Question

Денис Гончаренко @denis79513

Что подавать на вход нейронке?

В случае обработки изображения нейронкой все понятно, там берется изображение фиксированного размера и на вход нейронке подаются значения пикселей. А как быть, если количество входных данных может варьироваться? Например если нейронка должна делать какой-то вывод о слове, тогда вероятно на вход будут подаваться буквы этого слова, но их может быть разное количество.

Вопрос задан более трёх лет назад
149 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 3

6 комментариев

Денис Гончаренко @denis79513 Автор вопроса

Можно пример на каком-нибудь слове?

Написано более трёх лет назад
longclaps @longclaps
Денис Гончаренко,
"пример" -> "пример "
Написано более трёх лет назад
Денис Гончаренко @denis79513 Автор вопроса

Понятно что можно добить чем-то слово, но проблема в том, что при таком подходе местоположения суффиксов, окончаний не будут совпадать, то есть у одного слова на какие-то нейроны выпадет корень а у более короткого слова там будет уже окончание, что, как мне кажется не позволит нейронке выявить зависимости, связанные с частями слова.

Написано более трёх лет назад
longclaps @longclaps

Денис Гончаренко, я рад за тебя: ты умнее нейронки и помнишь морфологию. Но всё-таки я бы не стал утверждать, что паддинг не позволит нейронке выявить зависимости, ведь не части же слова ты ищешь.
Если всё-таки части - выбрось нейронку и воспользуйся библиотекой pymorphy.

Написано более трёх лет назад
Денис Гончаренко @denis79513 Автор вопроса

longclaps, не части слова ищу, но многие особенности слова зависят именно с частями слов. Так например часть речи в большинстве случаев определяется по суффиксов и окончанию.

Написано более трёх лет назад
longclaps @longclaps

Денис Гончаренко, ты главного не понял: нейронка сама решает, что важно а что нет, а если бы ты ей указывал - она бы была не более эффективна, чем ты.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 91 просмотр
1

ответ
Нейронные сети

Простой
Существуют ли нейросети делающие видео с персонажем по эскизу фото?
- 1 подписчик
- 08 авг.
- 85 просмотров
1

ответ
Видео

+1 ещё

Простой
Есть ли видео-нейросеть, дорисовывающая объекты к реальному видео?
- 1 подписчик
- 03 авг.
- 171 просмотр
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 297 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 44 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 56 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 67 просмотров
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 63 просмотра
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 232 просмотра
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 174 просмотра
2

ответа
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Стажер Моушен дизайнер для контента в соцсетях музыкального стартапа

Vocaberry

от 15 000 до 15 000 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

Answer 1 · 2019-10-20 09:39:11

Рассмотрим слова длины до 10 букв включительно. Наименьшее общее кратное из длин - 2520, наверное, это приемлемо.
Берёшь и подаёшь на входы:
"a" -> "a" * 2520
"ab" -> "a" * 1260 + "b" * 1260
и так далее.
ps Сам не пробовал.
pps Я просто показал, как можно реализовать "масштабирование". Но что мешает просто пополнить слово до максимальной длины пробелами? Наверное, недостаток ума и сообразительности ) Напридумывать способов можно множество.

Answer 2 · 2019-10-20 19:33:49

Примерный план действий:

Определяете среднюю длину слова в наборе
Токенизируете каждое слово
Удаляете "лишние" у очень длинных слов или "добавляете" недостающие знаки у коротких слов

Таким образом можно решить размерности входных данных. Пример для наглядности:

import numpy as np

from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

X = np.array(['диверсификация', 'приз', 'калейдоскоп'])

tokenizer = Tokenizer(char_level=True)
tokenizer.fit_on_texts(X)

X_tokenized = tokenizer.texts_to_sequences(X)
print(X_tokenized)

X_padded = pad_sequences(X_tokenized, maxlen=len(X_tokenized[2]), padding='post', truncating='post')
print(X_padded)

Answer 3 · 2019-10-21 00:55:26

Дорог может быть миллион в зависимости от того что автор хочет получить на выходе.
Если - посчитать количество гласных букв - то одно. Если категоризировать слово или слова
то это другое. И возможно тут нужна предобработка слов. Стемминг или лемматизация.

Вообще НС на вход получает векторы вещественных чисел. И преобразовать слово в эти векторы - большое искусство. Оно должно быть осмысленным. Если нам не удалось получить эти векторы - то бесполезно что либо делать. Нейронка на входе будет видеть шум. И никакого обобщения сделать не сможет.

Поэтому давайте в топике спросим а как звучит настоящее техническое задание?

Что подавать на вход нейронке?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт