1. Английский.
2. Основные алгоритмы.
3. Паттерны проектирования.
4. Asambler,WinApi(если прикладник под винду), c ,c++(хотя бы основы).
5. Глубоко знать основы языка на котором программируете.
6. Знать де находится оф. документация.(уметь ее пользоваться), после этого уже другие источники.
6. Лучшие практики языка.
7. Оптимизация.
8. СУБД(с какой работайте).
include('class.pdf2text.php');
$a = new PDF2Text();
$a->setFilename('Videographer_RFP.pdf'); //grab the test file at http://www.newyorklivearts.org/Videographer_RFP.pdf
$a->decodePDF();
echo $a->output();
Тока проблемы есть с некоторыми символами сам пока разбираюсь почему
Но тут будет чистый текст.
Не стоит!
К ним автоматически имеет доступ огромное число лиц.
Если вы храните данные то к ним имеет доступ только вы и хостинг!(и то вы их можете зашифровать и тому подобное).
А если храните данные на локальном сайте то к ним будут иметь доступ только вы=)
1. Файл со словарем.
2. Считывайте все в двумерный масив. Чтоб было примерно так MasWorld[0][0] = Атлетичный
3.[0] -буква по алфавиту
[1]-слово на определенною букву начиная с самого первого.
4.И потом перебирайте циклом веденное слово.
И в цикле:
Выбирайте массив соответственно букве считайте количество слов в начинающие на эту букву. И рандомом начиная с 0 до количества слов на эту букву выводите слово.
1.Досконально изучить PageRank.
2.Описания студенческой работы создателей гугла(прототип гугла) wseob.ru/seo/searchengine-anatomy
3. Начинать надо с алгоритмов которые будут учитываться в выдаче(тоесть определить факторы и как именно они будут влиять на построения выдачи)
4.Потом уже техническая реализация тут уже другие алгоритмы вступают в силу.Как быстрей найти?как перебрать?Как хранить страницу?По какому пути должен идти парсер и т.д. т.п.
Чаще всего проблем с проксями нету.
Но если хочешь проверить автоматически:
Делаешь запрос CURL через прокси(в цыкле подсовывая каждый раз новый прокси) на сайт которые тебе надо проверить
1. Вариант посылаешь HTTP GET запрос смотришь ответ
2. Вариант посылать HTTP HEAD запрос.Не будет приходить тело сэкономишь немного времени.
3. Вариант читать с потока тока первую строку если == HTTP/1.1 200 то прокси не заблокировано. Т. е . вариант еще быстрей.
Ну тайм аут для прокси еще поставить и тайм аут на ожидания ответа и тайм аут на время чтения данных.Вот вроде все для скоростного перебора.Ну еще многопоточность туда можешь прицепить CURL с ней вроде работает.
Читать, с каждой новой книжкой про PHP кругозор жёстко расширяется. ООП основательно знать что где применять . Использовать новый функционал последних версий. Ну и выучить что то из :Symfony, Yii, Lareval etc.