Сделать на каждую таблицу отдельно по одному запросу.
Я думаю не стоит химичить с union.
Во-первых, ты можешь сделать свой запрос еще "тяжелее".
Во-вторых, я не думаю что у тебя там очень большая нагруженность, что тебе приходиться извращаться с объединением запросов.
Ну и последнее, раз на то пошло дело, то сделай по принципу "толстого клиента". На js делай запрос на получение последних новостей по отдельности, как пример.
Берешь исходный файл делаешь из него копию file_bac.php или file_bac.txt
Спустя время сравниваешь исходный файл с содержимым file_bac.php или file_bac.txt и вуаля, готово.
Можно даже взять хеш от содержимого обоих файлов и сравнить их.
Взять содержимое из файла,вариантов куча от file_get_contents до file().
По onclick вызываешь ajax функцию.
Которая берез текст из твоего дива и отправляет на сервер.Там уже и записываешь.
Взять текст из вида примерно так на jquery. На JS можешь поискать сам, но это проще. $( div ).html();
Более конкретнее, какой язык, хотя бы. Может ты титан и будешь делать на асэмблере.
Потом, для чего тебе. Что бы действительно вести заметки или потренироваться.
Вариантов решения куча!!
Можешь зайти на гитхат в поиске вбить todo, к примеру. И тебе тысячи решений на разных языках, кстати лайфхак тебе))
Я думаю в производительности ты не потеряешь, но и смысла в этом большого я не вижу.
Я бы выбрал что-то одно, либо python, либо node, что более удобнее конкретно для тебя.
Я думаю и то и это, легко справятся с твоей задачей.
Я думаю не стоит пытаться что-то оптимизировать еще до того как у тебя что-то начинает ломаться)
Я для авито писал парсер на python + selenium.
Но это относительно давно было, работало)
Можешь так же попробовать. Правда тут скорость не мега огромная. Придется немного парсер сопровождать в процессе парсинга, к примеру проходить самому капчу(если не автоматизируешь).
Мы в фирме постоянно работаем по этапам.
Сделал, к примеру, часть по верстке, тебе перевели деньги. Сделал по бэкенд части, перевели деньги.
Намного безопаснее и отрезвляет заказчиков.
Я ни на что не намекаю, но я лично видел на гитхабе уже готовые фреймворки(библиотеки), парни написали под каждую из соц сетей. На php и python точно видел.
Заходишь туда и там ищешь.
Я был в обсуждениях с некоторыми парнями на счет скорости и удобства и бла бла бла работы на php.
Мне один парень сказал, что php скоро сдохнет. Но ему ответил второй программист:
Он уже дохнет столько лет, что уже выпустили "предсмертную"(сарказм) 7 версию(на момент обсуждения). А сейчас уже готовят 8 версию, которая будет еще быстрее.
И мое мнение.
Php не умрет никогда. Потому что всегда будут две стороны халявщиков.
1. Которая хочет быстро что-то выучить и на этом заработать.
2. Те кто хочет быстро и дешево заказать сайт.
И вот эти две стороны будут генерировать, назовем это, спросом на этот язык.
Конкретно сейчас я не беру в обсуждения профессиональные сайты, которые действительно крутые и действительно достойные внимания и людей которые посвятили этому языку львиную долю своего времени.
Выбери то, что ты хорошо знаешь. Или на крайний случай то в чем ты сможешь легко разобраться.
Знаешь юи? Делай на нем и не парься.
Я знаю django, я бы на нем стал делать. Но это не значит, что ты должен все бросить и делать на django или еще на чем.
Что значит анотации к статьям?? Они должны генерироваться?
--Если генерироваться, то это проблема. Это к нейронным сетям. А если просто, взять краткое описание из статьи, то не проблема.
Нужны абсолютно любые сайты или выборочно?
--проблема с парсингом, потому что у всей сайтов разная структура. И универсального парсера почти не существует. Можно конечно читать rss ленту сайта, но не у всех она есть.
Если сделать к пару тройку сайтов то не проблема.
Пока у тебя еще полностью не сформировалось понятие о том что такое большие нагрузки и как этим всем управлять.
Выдели пару дней прочитай отличную книгу
Ли_Атчисон_Масштабирование_приложений
С помощью подписей.
Есть открытый + закрытый ключ.
Закрытым ключом подписываем наши данные, отправляем серверу с открытым ключом.
На стороне api по открытым ключу ищем закрытый, то есть достоверный источник. Проверяем подпись. И если все ок, то пропускаем.
Есть класс на php и python, что бы можно было общаться в обе стороны, если разные языки.