обработка и анализ большого массива данных
можно найти (может быть а со скриптами ты перебрал.
Смотря, что конкретно тебя интересует.
но какие есть системы для анализа и обработки данных хотя бы в рамках собственного графического интерфейса? в принципе хочется то совершенно естественных вещей на мой взгляд графики там разные построить, кластеризовать данные, вычислить средние, посравнивать различные кластеры.. вообщем четкой задачи пока нет, но ведь должны быть системы, в которых можно было бы удобно эти данные повертеть, посмотреть!
Вроде специально для сбора статистики и практически с графикой.
Это единственное, что с ходу приходит в память. Есть и другие, но
вроде Statistica круче.
Можешь попробовать посмотреть в сторону OLAP, там похожие задачи, значит должны быть и решения.
Пишешь срипт в Delphi или VB и обрабатываешь все?
В SQL есть и дисперсия и среднее арифметическое...
Ну и Statistica, вроде, с базами данных умеет работать.
Самое лучшее, если Statistica - это то что я думаю и она умеет работать с базами - такая связка была бы удобна.
тогда сразу вопрос - у кого есть дистрибутив Statistic'и ? в сети все у кого она расшарена - offline.
Еще есть программа Origin, тоже вроде с БД работает.
http://root.cern.ch/
достаточно неплохой вариант, но, возможно, несколько специфический.
достаточно неплохой вариант, но, возможно, несколько специфический.
аргументируй
MS SQL Server + Excel (лучше XP или старше)
для сиквела миллион записей ерунда, так же как и для Excel в роли OLAP клиента.
P.S. можно pivot tablе замутить или OLAP куб.
Crystal Reports 9, там тоже вроде сейчас OLAP есть
>аргументируй
не хочет он открывать таблицы более чем с 65535 строками.
хотя, если ты предлагаешь его прицепить к SQL Server'у, и если он это умеет...
можно попробовать поставить SQLServer. только у меня Win2000.
OLAP интересная штука оказалось : ) надо только клиента с сервером найти и поставить.
Разумеется в тех разрезах, что ты будешь смотреть не может быть более 255 столбцов и ... строк, но вряд ли ты собираешься просто при помощи Excel просматривать записи, что-то вычислять будешь, аггрегировать, конечные срезы дожны быть явно меньше ограничений Excel. Ну если OLAP понравится, прямая дорога от MS SQL к Analysys Services.
P.S. все это дело (связка ms sql + excel) будет требовательна к памяти. Например, сталкивался с таким пайвотом (источник 1.2*10^6 строк который на машинах с объемом оперативки <=128 не обновляется (ошибка: нехватает памяти)
Напиши на какой OLAP системе ты остановился (я тоже этим интересуюсь).
На нем разрезы хорошо смотреть, а для дисперсии или кластеризации точность снижается кластеры можно потерять, так как данные не полные...
Про статистику: по второму пункту теста FASMI, любое средство многомерного анализа, позволяет выполнить любой логический и статистический анализ, характерного для данного приложения ...
В любом случае нужно копать в сторону OLAP, могу посоветовать:
http://www.olap.ru
OLAP форум на sql.ru
я праильно понимаю, что если не писать своего клинта, то клиентами для MS SQLServer и Analysys Services выступают Excel или Access, т.е. какого либо отдельного приложения Microsoft не предоставляет?
для разработкиков в Analysys S. есть Analysis Manager (аналог EM для сиквела, так же есть аналог QA)
в остальном так ты написал
http://office.microsoft.com в списке продуктов его нет. Я его только по поиску нашел. И я так понимаю Microsoft Data Analyzer недавно вышел?
Спасибо, что сказал о Microsoft Data Analyzer, а то я смотрю в Books Online для SQLServer и там ничего про готового клиента не говориться. Вообще странно прога входит в Office, но на
похоже оно появилось в только в офисе XP, знаю что есть такое и примерно для чего, но никогда не работал с этим приложением. информации действительно мало, в msdn в соотв. разделе <10 статей. если будешь разбираться с этим зверьком, поделись опытом, раскажи что это.
Оставить комментарий
tarajna
есть несколько связанных таблиц с числом записей ~миллиона. знаете ли вы какую нибудь систему для того чтобы эти данные можн обыло покрутить и посмотреть с разных сторон? в идеале чтобы можно было делать простой анализ данных (средние,дисперсия, графики, кластеризация) в графической оболочке самой системы, но также чтобы в ней можно было делать sql запросы и тут же писать скрипты на каком нибудь нормальном языке(C, Delphi, Java, Fortran..) для более тонкой обработки и анализа полученных данных. наверняка ведь такие проги есть! как-то ведь люди работают с большими массивами данных. подскажите плз, кто что знает..скажу сразу, Excel не совсем подходит