Военная команда проекта не уточнила, с какой платформы социальных сетей она собирается собирать данные.
Сообщения должны быть общедоступными, поступать как минимум из 100 разных стран и включать как минимум 60 разных языков.
Они также должны быть написаны в 2014-2016 годами.
Подробности были раскрыты в тендерном документе Морской аспирантуры для фирмы, чтобы предоставить данные.
Дополнительные требования включают в себя:
- сообщения должны быть не менее 200 миллионов уникальных пользователей;
- не более 30% может прибыть из конкретной страны;
- не менее 50% должно быть на языке, отличном от английского;
- информация о местоположении должна быть включена как минимум в 20% записей.
Личные сообщения и информация о пользователях не будут являться частью базы данных.
«Данные в социальных сетях позволят нам впервые измерить, как разговорные выражения и сленг развиваются с течением времени в разнообразных человеческих обществах, чтобы мы могли начать понимать, как и почему сообщества формируются вокруг определенных форм общения », - сказал Bloomberg ведущий исследователь проекта Т. Камбер Уоррен.
Военно-морской флот США стоял за созданием Tor, анонимной сети просмотра, в 2002 году.
Tor, также известный как Onion Router, стремится скрыть, откуда люди выходят в Интернет, используя шифрование и случайное перенаправление запросов на веб-страницы через сеть разных компьютеров.