Откуда берутся данные?


       Во всех системах статистики отражается информация о данных из тех событий, которые происходят при обращении браузера пользователя к веб-серверам, которые обслуживают сайты. Эти события фиксируются в журнале сайта – логах.
Логи сайта
        Когда пользователь обращается к сайту, происходит ряд определенных событий. Во-первых, осуществляется запрос страницы – браузер пользователя передает на веб-сервер запрос на выдачу страницы. При этом на сервер поступает информация об IP-адресе клиента, запрашиваемый адрес, время и дата запроса, а также дополнительные параметры: браузер, которым пользуется человек, URL предыдущей страницы (с которой осуществлен переход), имя пользователя и пароль. Во-вторых, происходит выдача страницы – сервер отдает клиенту запрошенные документы (сайт или картинку). В-третьих, осуществляется запись в логии – сервер фиксирует данные в журнальном файле о том, какая произошла транзакция.
Обычно интернет страницы состоят из HTML-текста и какого-то количества изображений, вставленных в текст. Все они поступают в браузер пользователя отдельно, поэтому при запросе страницы происходит некоторое количество транзакцию, которые записываются в логах по отдельности.
       Также, раскрутка сайта требует помнить об особенностях составных документов. Для каждого документа – текста во фрейме, изображения, стилевого файла, браузер пользователя делает отдельный запрос. А элементы составного документа могут браться не с одного сайта, а с нескольких серверов. В подобном случае адреса всех составляющих документа будут описываться в основном документе – внешнем. И в результате, информация о запрашиваемой странице появится не только в логах сайта, но и зафиксируется в журнальных файлах соответствующих серверов
       Журнальные файлы – это сырые, необработанные данные, которые нуждаются в тщательном анализе. Качество той статистической системы, которая используется на сайте, как раз и зависит от качества обработки этих сырых данных.
Следует также отметить, что вся необходимая информация содержится именно в логах сайта, и больше не существует никаких других данных о посещаемости сайта.