Интеллектуальный
помощник
для создания учебных
материалов
Состав проектной команды
Ученики “МАОУ Гимназии №2”
г. Великий Новгород
Безлаковская Ника – дизайнер 10СЭ2 vk:bezliknik
Клепко Георгий – программист 11Т vk:ronin_6061
Наумов Михаил – программист 11Т vk:mikle.naumov
Гринчишин Михаил Александрович - наставник vk:grinm
Проблема
Проблема информационного перегруза у студентов.
В современном образовательном процессе студенты сталкиваются
с огромным объемом информации, который ежедневно поступает к
ним из различных источников. Особенно это касается студентов
высших учебных заведений, где учебный процесс насыщен лекциями,
семинарами, лабораторными работами и самостоятельными
заданиями. Каждый курс требует от студентов усвоения значительного
количества теоретических знаний и практических навыков, что
зачастую приводит к информационному перегрузу.
Одной из основных причин проблем с усвоением информации
является не только объем материала, но и его сложность. На старших
курсах студенты сталкиваются с углубленными дисциплинами,
которые требуют не только базовых знаний, но и способности
интегрировать информацию из различных областей. Это создаёт
необходимость в более глубоком анализе и понимании, что часто
бывает трудным для студентов, которые могут не успевать за темпом учебного процесса.
С увеличением объема учебного материала возникает еще одна
проблема: поиск кратких и точных ответов на специфические вопросы. В
интернете доступно множество ресурсов, но зачастую студенты не находят
нужной информации быстро и эффективно. Это может быть связано с тем,
что:
- Качество информации: Не все интернет-источники являются надежными, и
студенты часто сталкиваются с противоречивыми данными.
- Нехватка времени: В условиях ограниченного времени на подготовку и
выполнение заданий, студенты не могут позволить себе тратить часы на
поиск нужной информации.
- Специфика вопросов: Многие вопросы требуют глубокой проработки и
понимания темы, что невозможно получить из кратких ответов или статей.
В условиях современного образования информационный перегруз
становится серьезной проблемой, с которой сталкиваются студенты на
старших курсах. Понимание этой проблемы и принятие мер для её решения
могут помочь создать более комфортную и продуктивную образовательную
среду, способствующую успешному обучению и развитию студентов.
Предлагаемое решение проблемы
Функциональность приложения:
- Автоматическое создание конспектов из
аудиозаписей и видеозаписей.
- Генерация оптимальных планов для
освоения материала.
- Создание карточек и тестов для
запоминания.
- С помощью рукописного шрифта.
Конкурентные преимущества:
- Интеграция различных функций в одном
приложении.
- Высокая точность анализа и генерации
информации благодаря использованию
современных моделей машинного обучения.

Аналоги
Мы проанализировали приложения и сайты, похожие на наши, и заметили, что многие из них предлагают ограниченный набор функций, что затрудняет работу с различными форматами информации, такими как аудио, видео и большие тексты. Например, некоторые приложения могут преобразовывать текст, но не поддерживают интеграцию видеоуроков или работу с аудиодокументами.

Поэтому мы решили создать бота, который объединяет все необходимые инструменты для удобного и эффективного создания конспектов в одном интерфейсе.
1. КонспектМейкер
2. SmartNote
3. Синопсис
4. КонспектАи
5. EduСводка
Вот примеры сайтов которые могут сгенерировать вам текст.
Цели проекта

Разработать интеллектуального помощника, который будет помогать ученикам старшей школы и студентам вузов в создании качественных и структурированных конспектов по учебным материалам, облегчая процесс обучения и усвоения информации.
Задачи проекта
1. Анализ потребностей пользователей:

2. Разработка функциональных требований:
- Определить ключевые функции, которые должен выполнять интеллектуальный помощник.

3. Создание алгоритмов обработки информации:
- Разработать алгоритмы для анализа и обработки текстов, включая методы машинного обучения и обработки естественного языка.
- Обеспечить возможность адаптации конспектов под различные форматы (текстовые, графические, мультимедийные).

4. Разработка пользовательского интерфейса:
- Создать интуитивно понятный интерфейс, позволяющий легко взаимодействовать с помощником.
- Обеспечить возможность редактирования и персонализации конспектов.

5. Тестирование:
- Провести тестирование.
- Внести необходимые изменения и улучшения на основе полученных данных.

6. Оценка эффективности:
- Разработать критерии для оценки эффективности использования помощника в учебном процессе.
- Собрать и проанализировать данные о том, как использование помощника влияет на успеваемость и понимание учебного материала.

7. Тестирование:
- Провести тестирование системы с участием целевой аудитории, собирая отзывы о функциональности и удобстве использования.
- Внести необходимые изменения и улучшения на основе полученных данных.
Описание отдельных шагов плана
1. Сбор данных
• Необходимые данные:
o Аудиозаписи: Записи разговоров, интервью, лекций и подкастов.
Желательно иметь разнообразие акцентов и языков.
o Тексты: Транскрипции аудиозаписей, которые соответствуют
аудиофайлам. Можно использовать как открытые наборы данных,
так и собственные записи.
• Источники данных:
Открытые наборы данных:
o Common Voice: Многоязычный набор данных для распознавания
речи.
o LibriSpeech: Набор данных для автоматического распознавания речи,
основанный на аудиокнигах.
o TED-LIUM: Записи TED Talks с транскрипциями.
• Сбор собственных данных:
o Использование краудсорсинга для записи аудио от различных
пользователей через платформы типа Amazon Mechanical Turk.
2. Разметка данных
• Процесс разметки:
o Инструменты: Использование Labelbox или Prodigy для разметки
аудиозаписей и соответствующих текстов.
• Типы разметки:
o Разметка временных меток (time-stamping) для аудио.
o Разделение на сегменты (например, по предложениям или абзацам).
• Качество разметки:
o Обучение разметчиков стандартам разметки и использование
несколько рецензентов для повышения качества.
3. Создание модели
• Выбор библиотек:
o Использование TensorFlow или PyTorch для создания и обучения моделей.
• Архитектура модели:
o LSTM (Long Short-Term Memory): Подходит для обработки последовательностей,
таких как аудиоданные.
o Структура: Входной слой -> LSTM слои -> Полносвязный слой -> Выходной слой
(например, для классификации или регрессии).
o BERT (Bidirectional Encoder Representations from Transformers): Для обработки текстовой
информации и понимания контекста.
o Использование предобученных моделей BERT из библиотеки Hugging Face
Transformers и дообучение их на наших данных.
• Обучение модели:
o Разделение данных на обучающие, валидационные и тестовые выборки
(например, 70/15/15).
o Настройка гиперпараметров (количество эпох, размер батча, скорость обучения) с
использованием кросс-валидации.
4. Интеграция в систему
• Архитектура приложения:
o Frontend: Использование React для создания интерфейса пользователя.
Разработка компонентов для загрузки аудио, отображения результатов
транскрипции и анализа.
o Backend: Создание RESTful API на основе Flask или FastAPI для обработки
запросов от фронтенда.
o База данных: Использование PostgreSQL или MongoDB для хранения
аудиозаписей, транскрипций и метаданных.
• Интерфейс:
o Создание прототипа в Figma, чтобы визуализировать пользовательский
интерфейс и получить обратную связь от потенциальных пользователей.
5. Тестирование и отладка
• Юзабилити-тесты:
o Проведение тестирование с реальными пользователями для выявления проблем
в интерфейсе и функциональности.
• Автоматизированное тестирование:
o Написание тестов для API с использованием библиотеки pytest или Postman.
o Проведение нагрузочного тестирования для оценки производительности системы
под высокой нагрузкой.
• Исправление ошибок:
o Создание системы отслеживания ошибок (например, Jira или Trello) для управления
найденными проблемами и их устранением.
Дизайн

В качестве дизайна приложение мы решили отталкивается дизайном сайта Томского Политехнического Университета.
Наш чат может находится на сайте в отдельном приложении или мессенджере телеграм.

Как работает программа:

Пример работы одной из функций нашей программы.
Социальный опрос

Нашей командой в Новгородском Государственном Университете был
проведен социологический опрос среди студентов первых, вторых, третьих и
четвертых курсов. Цель опроса — выяснить, насколько большой объём
информации предоставляется учащимся в процессе обучения. Студентов просят
ответить на несколько вопросов о том, как часто им отправляют лекции в
формате видео или аудиозаписей, и насколько удобно им находить необходимую
информацию в интернете, ответ был сформулирован в виде “Да” или ”Нет”.
После опроса мы вывели, что учащимся 3 и 4 курса все сложнее находить
информацию в интернете, а лекции становятся все объёмнее даже в аудио и видео формате.
Будущий партнер или заказчик

В перспективе проекта нашей нейросити будут является ведущий вузы страны например Томский Политехнический Университет.
Смета на создание неиро сети
Репозиторий на GitHub
https://github.com/N1k1tqq/AI_SIRIUS/releases/tag/publish