SAS
Обзор продуктов SAS
22 марта 2009 в 20:13

Обзор продуктов SAS

Привет, выложил в интернет статью «Продукты и решения SAS» (http://www.sasbi.ru/?page_id=159). Интересно услышать вопросы от пользователй и получить комментарии от специалистов SAS.

5145
  • Тема закрыта
Комментарии (33)
  • 22 марта 2009 в 21:45 • #
    Павел Бритов

    Для очень! краткого вступления - неплохо. Начинание смелое! Вообще на моей памяти (за последние 15! лет) было много попыток написать, что такое SAS на пару страниц, но все не очень удачные. ;)))

    Замечания: Macro и Maps не являются самостоятельными продуктами, а входят в Base SAS и SAS/Graph соответственно.

  • 24 марта 2009 в 00:28 • #
    Олег Соловьев

    Спасибо, за положительный отзыв. По поводу Macro и Graph. Думаю, не буду объединять их в статье. Просто оставлю комментарий.

  • 23 марта 2009 в 16:13 • #
    Егор Липчинский

    Неплохая попытка составить реестр базовых продуктов. Я думаю полезно для главы термины и сокращения в любом документе для заказчика. Группировка иногда вызывает сомнения, например Information Delivery Portal указан как инструмент разработчика, но не указан как интерфейс пользователя, хотя по моему, на практике все как раз наоборот. И главное - сам САС сейчас пытается работать на другом уровне - на уровне Solutions. Так что статья выглядить немного устарелой.

  • 24 марта 2009 в 00:38 • #
    Олег Соловьев

    Да, у меня тоже были сомнения к какому разделу отнести портал. Посмотрим, что скажут коллеги. У меня есть идея написать аналогичную статью про решения (solutions). Но поскольку ни с одним из них не работал, то максимум что смогу - выжать воду из маркетинговых проспектов SAS.

  • 24 марта 2009 в 01:53 • #
    Павел Бритов

    Действительно, сама компания старается продукты не выделять. Иногда почти невозможно объяснить деление на тот или иной продукт (модуль), что вызывает лишние вопросы и раздражение пользователей.

    Например, продукт SAS/HPF не поставляется отдельно, а только в комплекте с SAS/ETS и SAS Forecast Studio. Решение называется SAS Forecast Server.

    Если сравнивать продукты по объему программного кода, то некоторые отличаются в сотни и тысячи раз.

    Поэтому, такой список (как в статье) можно расценивать только как материал "для справки", без особого практического применения.

    Было бы интересно другое. Известно, что один и тот же результат в SAS можно получить многими способами. Поэтому, полезным был бы список решаемых задач с указанием перечня продуктов и способов, которыми эти задачи решаются.

  • 24 марта 2009 в 09:52 • #
    Егор Липчинский

    Эко ты загнул... у меня например с МПСовских курсов есть некоторые возможные варианты решения для достаточно простой задачи - построение отчета в сравнении с прошлым годом, с оценкой производительности - только на это ушло сколько времени - а ты так глобально задачу ставишь!

  • 26 марта 2009 в 18:59 • #
    Павел Бритов

    Ну да... фантазирую ;)

    Тогда надо четко определить цель описания продуктов -
    - понять что такое САС?
    - подобрать нужный пакет?
    - расширить кругозор, тем кто уже в курсе?
    или что-то еще

  • 1 апреля 2009 в 05:26 • #
    Олег Соловьев

    Изначально планировал, что это будет корневая страница с сылками на демонстрацию продуктов. Сейчас основная прболема - это техническая. Файл с записью получается слишком большой, чтобы публиковать его на сайте.

    Интересно, насколько легально делать запись демонстрации продуктов? Нужно ли официальное разрешение от производителя?

  • 8 апреля 2009 в 23:56 • #
    Роман Волынец

    Видео-ролики можно публиковать не на собственном сайте, а, например, на YouTube (до 10 минут, до 1 GB).

    Ролики по использованию продуктов SAS там уже можно найти:
    См. например: http://www.youtube.com/watch?v=20NA1i-WY4Q (SAS Enterprise Guide Cube Measures)

    Однако, видео не самый удобный способ дать информацию о продукте.
    На мой взгляд, более подходящим вариантом является создание презентаций PowerPoint с серией скриншотов и необходимыми текстовыми пояснениями.

  • 10 апреля 2009 в 03:42 • #
    Олег Соловьев

    Не соглашусь. Уверен, видео самый эффективный способ презентации ПО. Главное, чтобы ведео было интересным. Хотел сделать примерно так, как у Тинькова в блоге, например: http://www.finansmag.ru/blogs/post/282.

    Если нет желания читать, рядом есть видео, где тот же самый текст проговариватся с демонстрацией ПО.

    Еще у SAS в e-learning появилась интересная фича. Слева - текст урока, справа - флешка, в которой демонстрируются, что нужно сделать, чтобы получить нужный результат.

  • 10 апреля 2009 в 22:42 • #
    Роман Волынец

    Проблема с видео - если ты собрался показывать там экраны продуктов SAS, - что либо ничего нельзя будет рассмотреть, либо файл с видео (хорошего разрешения) будет огромного размера.

  • 8 апреля 2009 в 23:21 • #
    Роман Волынец

    Олег!

    По поводу JMP: в твоей статье приведена неверная информация (о происхождении продукта). JMP - вообще не является приобретением SAS, это собственная разработка SAS.

    Интересное обсуждение этого вопроса можно найти здесь:
    http://www.listserv.uga.edu/cgi-bin/wa?A2=ind0802c&L=sas-l&P=59279

    Аббревиатура JMP образована от "John's Mac Program", ссылка на автора этого проекта - Джона Сала (John Sall), одного из основателей SAS, а на текущий момент Вице-Президента SAS, возглавляющего бизнес подразделения JMP:
    http://www.sas.com/presscenter/bios/jsall.html

  • 10 апреля 2009 в 03:55 • #
    Олег Соловьев

    Темная какая-то история. Но все равно поправил. Спасибо.

    Странно, что SAS решил развивать новый продукт, который во многом дублирует то, что уже есть. Один из наших профессоров - бывший сотрудник SAS рассказывал, что Jim Goodnight долгое время не хотел интегрировать JMP с остальными продуктами SAS. Видимо, потому, что JMP дублирует много из того, что у SAS уже есть, а стоит дешевле. Т.е. прямой конкурент.

  • 11 апреля 2009 в 20:28 • #
    Павел Бритов

    История старая как SAS. ;) Джон давно и часто ругается с Джимом. В своё время он яростно пропагандировал именно хорошие интерфейсы конечного пользователя. С его подачи появился SAS/Insight. А JMP был изначально только для Макинтошей, т.к. САСа там не было. Сейчас JMP действительно конкурент САС для задач с не очень большим объемом данных, но позиционируется как персональное средство, в отличии от Системы САС.

  • 12 апреля 2009 в 23:40 • #
    Роман Волынец

    JMP - это персональное средство для интерактивного статистического анализа.
    SAS его характеризует как desktop statistical product.
    JMP представляет собой продукт того же класса, что и продукты STATGRAPHICS, SPSS, Statistica, StatView, SPlus, Minitab и др.

    С какими продуктами конкурирует JMP:
    1) с базовыми статистическими продуктами (Base SAS, SAS/STAT, SAS/ETS, SAS/OR, SAS/GRAPH)
    2) c Enterprise Guide (как с интерфейсом к базовыми статистическим продуктам)
    3) с SAS/Insight (интерактивная статистика)
    4) c Enterprise Miner (задачи Data Mining - регрессионный анализ, нейронные сети, деревья решений)

    Статья по теме: "JMP® vs SAS® Overview"
    http://www2.sas.com/proceedings/sugi30/169-30.pdf

    Разговоры о конкурировании продуктов ведутся примерно с1994:
    "SAS or JMP?"
    http://www.biostat.wustl.edu/archives/html/jmp-l/1994/msg00017.html

    Сравнительных материалов по SAS и JMP очень мало. Компания SAS эти продукты не сравнивает и не позиционирует как конкурентные решения. Скорее, JMP позиционируется как дополнение к SAS, а версия JMP 8 может работать с серверами SAS (SAS 9.1.3 и SAS 9.2):
    http://www.jmp.com/software/jmp8/keyfeatures.shtml

    В России пользователей JMP практически нет. Интерфейс JMP не русифицирован (поддерживаются языки English, Japanese, Chinese, French, German, Korean).

  • 15 апреля 2009 в 13:48 • #
    Валерий Лисейкин

    SAS еще позиционирует в этой нише
    Visual Data Discovery
    Analytics Pro

    Не смогли бы Вы дать какие-то ссылки на краткие сравнительные обзоры? или свое видение?
    Не слишком ли много у SAS продуктов для персонального средства интерактивного статистического анализа?

    Тоже страдаю от отсутствия сравнительных материалов этих самых средств интерактивного статистического анализа

  • 18 апреля 2009 в 22:54 • #
    Олег Соловьев

    В описании Visual Data Discovery (http://www.sas.com/technologies/analytics/statistics/datadiscovery/) сказано: It combines three of SAS' most popular software products (Base SAS®, SAS/STAT® and SAS/GRAPH®) with JMP®. Т.е. под названием Visual Data Discovery SAS продает четры своих базовых продукта.

    В описании Analytics Pro (http://www.sas.com/technologies/analytics/analyticspro-factsheet.pdf): SAS Analytics Pro combines three of SAS’ top-selling products (Base SAS, SAS/STAT, SAS/GRAPH). Т.е. тот же Visual Data Discovery, но без JMP.

    У SAS есть понятия "продукт" и "решение". Продукт - ПО выполняющее одну основную функцию. Решение - комбинация продуктов. Количество продуктов у SAS не очень большое, а количество решений огромное. Поэтому каждый раз когда я слышу о новом решении, смотрю какие продукты в него входят. Так проще.

  • 21 апреля 2009 в 21:02 • #
    Роман Волынец

    О.Соловьев прав - в отношении "продуктов" и "решений".

    Однако, разница между решениями SAS Analytics Pro и SAS Visual Data Discovery не только в продукте JMP.

    Судя по описанию продуктов на сайте SAS
    - http://www.sas.com/technologies/analytics/statistics/analytics-pro/index.html#section=5
    - http://www.sas.com/technologies/analytics/statistics/datadiscovery/#section=5
    SAS Visual Data Discovery изначально позиционируется как корпоративное решение (пользователи работающие с сервером), а SAS Analytics Pro - как инструмент персональной работы, который может быть "расширен" до корпоративного решения.

    Кроме того, в оба решения еще входит Enterprise Guide.

    Если Вы знаете - что именно из продуктов SAS Вам нужно, запрашивайте в московском офисе SAS прайс-листы на все пакеты, предлагаемые SAS, включающие требуемые продукты, уточняйте состав пакетов и выбирайте по предлагаемому функционалу и стоимости лицензий.

  • 21 апреля 2009 в 20:26 • #
    Роман Волынец

    Из статьи: "Base SAS – это СУБД, с собственным форматом данных и языком программирования."

    В принципе, правильно. Однако, боюсь, что у большинства IT-специалистов (да и не только IT-специалистов) термин "СУБД" вызывает прежде всего ассоциации с такими системами управления базами данных как Oracle, DB2, MS SQL Server и т.д. - с возможностями по управлению пользователями, поддержкой транзакционной работы и возможностью одновременной работы пользователей с данными в режимах чтения и записи - чего Base SAS предоставить не может.

    Аналогично - термин "язык программирования" также вызывает определенные ассоциации (С, Pascal, VB, Java, ...).

    Для того, чтобы снизить вероятность неправильной интерпретации, я бы переформулировал определение следующим образом: "Base SAS – это файловая нетранзакционная СУБД с собственным языком обработки данных".

  • 22 апреля 2009 в 02:02 • #
    Олег Соловьев

    Согласен, Роман, исправил. Я бы то такого не догадался :) Спасибо за редакторскую правку.

  • 25 июня 2009 в 09:55 • #
    - -

    Увы, у меня ссылка не открывается. Пустая страница.

  • 25 июня 2009 в 22:25 • #
    Роман Волынец

    Статья почему-то сменила адрес.
    Теперь доступна здесь: http://www.sasbi.ru/?p=180

  • 25 июня 2009 в 22:41 • #
    - -

    "ETL Studio

    Графический интерфейс пользователя для создания ETL-процессов. Представляет ETL-процесс в виде диаграммы, что упрощает понимание процесса: входных и выходных данных, основных преобразований и т.д. Для работы с продуктом не требуеся знаний языков программирования. Пользователь может создавать ETL-процессы используя только интерфейс point and click."

    Я так понимаю что ETL это как бесплатная включенная фича? А есть какая-нибудь информация о скорости выполнения ETL-операций? Хотя бы грубо, на уровне ТБ в час.

  • 29 июня 2009 в 21:12 • #
    Олег Соловьев

    Думаю, что ответа на вопрос о скорости нет.

    Некорректно судить о скорости ETL-средства по цифре Тб/час. Если говорить о простом копировании без преобразований данных, то у любого производителя скорость должна быть близка к максимальной пропускной скорости оборудования - жестких дисков, сетевых карт etc. Иначе бы любой клиент поднял бы по этому поводу шум.

    Если пытаться посчитать скорость ETL-средства, с учетом преобразований данных, то тут все усложняется до невозможности. Уверен, что каждое ПО лидирует в своем классе преобразований.

    Скорее всего именно по этому еще не придумали тестов на производительность ETL-средств - слишком много факторов, которые невозможно учесть.

  • 29 июня 2009 в 21:38 • #
    - -

    Олег, при всём уважении, пожалуй, не соглашусь что даже при простом копировании скорость различных систем будет одинакова. Есть масса примеров из других областей вычислений где это утверждение не справедливо. Потери есть всегда, а вечных двигателей не существует ;)
    Дабы не быть голословным, сошлюсь на третью сторону - http://it.toolbox.com/blogs/infosphere/etl-benchmark-favours-datastage-and-talend-28695

    Кстати говоря, TPC недавно заявила что собирается определить и стандартизировать тест производительности ETL.
    На мой взгляд после этого можно вполне объективно судить о скорости ETL в цифрах ТБ/час.
    Что скажете, коллеги?

  • 30 июня 2009 в 10:48 • #
    Сергей Тищенко

    Виталий, если мы говорим только о DI Studio(ETL Studio), то это отнюдь не бесплатная фича и поставляется она не со всеми решениями. Например, DI Studio включена в состав SAS Data Integration Server, а в SAS Analytics Pro - нет.

  • 1 июля 2009 в 13:41 • #
    Федор Хилькевич

    SAS система кросс-платформенная, как с точки зрения операционой системы, так и с точки зрения форматов данных. Что с чем сравниваем? Какова точка отсчета? Что во что трансформируем? Из чего извлекаем, куда загружаем? Думаю, что ТБ в час адекватной оценкой точно являться не может, скорее уж некие условные операции. Касательно DI Studio как ETL средства. Это просто графический интерфейс упрощающий работу с SAS Base. Позволяет визуализировать процессы ETL и регистрировать их в системе метаданных(!).Содержит набор компонентов, позволяющих осуществлять типовые операции в рамках ETL: процессов. При этом производителность определяется не этим средством, а именно лежащим в ее основе SAS Base. Если говорить об эффективности стандартных алгоритмов, то как любой универсальный алгоритм, имеет свои плюсы и минусы. С одной стороны ускоряет работу разработчика и позволяет не заботиться о множестве мелочей, которые стоит учесть, с другой, именно в силу своей универсальности, всегда может быть оптимизирован под конкретную ситуацию.

  • 4 июля 2009 в 23:06 • #
    Роман Волынец

    SAs периодически проводит тестирование производительности своих ETL-решений. Обычно в кооперации с производителями серверов.

    Например, тестирование SAS Enterprise Data Integration Server в мае 2006 г. на сервере Sun Fire E25K с процессорами UltraSPARC IV+ под управлением ОС Solaris 10 и дисковыми массивами Sun StorEdge SAM-FS/QFS показало скорость обработки данных в 3.9 TB в час, или 81.2 ГБ/час на 1 процессор, что на тот момент являлось рекордом среди других опубликованных результатов тестов.

    http://www.sas.com/news/feature/29may06/direcord.html

    Тестирование SAS Enterprise Data Integration Server с использованием SAS Grid Manager в апреле 2007 г. на сервере Sun Fire™ E25K с 72 процессорами под управлением ОС Solaris 10 и 20 дисковыми массивами Sun StorageTek 6140 с файловой системой Sun StorageTek QFS показало скорость обработки данных в 1.7 TB за 17 минут, что составляет 5.97 TB в час (на тот момент также мировой рекорд в области тестов по производительности ETL).

    http://www.sas.com/news/preleases/041707/news9SASSUN.html
    http://support.sas.com/rnd/scalability/grid/benchmarking.html

  • 4 июля 2009 в 12:39 • #
    - -

    Коллеги, спасибо за комментарии :) Весьма познавательно!
    Последний вопрос, а практикуется ли использование с SAS сторонних решений по ETL?

  • 4 июля 2009 в 23:16 • #
    Роман Волынец

    Сторонние ETL-решения могут запускать программы SAS.
    Самый простой вариант - запуск процесса SAS из командной строки (файл sas.exe с набором параметров).

    Есть также примеры более тесной интеграции.
    Например, SAS DataStage Plugin (обеспечивает возможность обращения к данным SAS и выполнения кода SAS).
    http://it.toolbox.com/wiki/index.php/SAS_DataStage_Plugin

  • 14 августа 2009 в 09:49 • #
    Валерий Лисейкин

    У нас немного по старинке...
    из программного комплекса на Дельфи обращаемся к САС как к сереверу автоматизации через механизм OLE, - запускаем программы, анализируем логи,...

  • 25 августа 2009 в 15:57 • #
    Павел Бритов

    Интересно и занимательно. ;)

    Если продолжить перечень "не совсем традиционного" использования SAS, то мы в банке РБР организовали вызов SAS как приложения SOA из фрон-офиса Диасофт СОЗ. Работает на Ура!

  • 20 ноября 2009 в 17:47 • #
    Роман Волынец

    Статью "Продукты и решения SAS", которая обсуждаась в данной теме, можно найти на сайте http://www.sasbi.ru.

    Поскольку ссылки на статьи на сайте http://www.sasbi.ru, к сожалению, не являются постоянными (время от времени меняются), я приведу текст данной статьи в этой теме (с любезного разрешения О.Соловьева).

    Обзор продуктов SAS
    ===================

    О.Соловьев, 7.03.2009

    Многими специалистами в России SAS воспринимается как ПО для статистического анализа. Между тем, еще лет двадцать назад, SAS начал развивать линейку продуктов для Хранилищ Данных и сейчас уже конкурирует с такими компаниями как Oracle, IBM и Microsoft.

    Пержде чем приступить к описанию возможностей SAS нужно разобраться в двух терминах “продукт” и ”решение”. Продуктом называют “элементарное” (неделимое) ПО, которое выполняет одну техническую функцию. Например, продукты это СУБД, клиент для работы с СУБД, портал, и т.д. Решение – это совокупность продуктов, обеспечивающих выполнение стандартных процессов в определенной отрасли. Например, SAS предлагает решения для банков, телекома, страховых компаний и т.д. Как правило, решения содержат готовые схемы данных для Хранилища SAS, отчеты и интерфейс пользователя, оптимизированные под конкретную задачу.

    В данной статье рассмотрены только продукты SAS. Решения SAS будут описаны в последующих статьях.

    SAS Foundation
    Часть своих продуктов SAS выделяет в отдельную категорию SAS Foundation. В нее входят СУБД, ПО для подключения к сторонними СУБД, ПО с процедурами для стат. анализа и т.д. SAS Foundation – это “начинка” которую не видят пользователи, но, именно она выполняет основную работу. И так по порядку.

    Base SAS
    Это файловая нетранзакционная СУБД с собственным языком обработки данных. Помимо работы с таблицами Base позволяет считывать данные из текстовых файлов, XML, Excel файлов и создавать отчеты в разных форматах: HTML, Excel, PDF и т.д. Base поддерживает язык SQL, что упрощает изучение SAS многим IT-специалистам.

    SAS Macro
    Язык-надстройка над Base SAS. Позволяет организовывать различные виды ветвлений и циклов в программах Base SAS. Используется для создания хранимых процедур. Является аналогом PL от Oracle или T-SQL от Sybase. Официально Macro входит в состав продукта Base SAS

    SAS/Share
    Позволяет нескольким пользователем работать с СУБД одновременно. Решает проблемы конфликтов транзакций при обновлении таблицы одновременно несколькими пользователями.

    SAS/ACCESS
    Это серия продуктов для подключения SAS к сторонными СУБД. Наиболее популярный продукт из этой серии это SAS/ACCESS for ODBC, который позволяет SAS работать с любой СУБД, поддерживающей технологию ODBC. Также в серию входят продукты специально разработанные под конкретные СУБД, среди которых ACCESS for Oracle, ACCESS for Microsoft SQL Server и т.д.

    SAS/Connect
    Обеспечивает взаимодействие между ПО SAS, установленным на разных компьютерах. Позволяеет программе, запущенной на одной машине, управлять выполнением программ на другой машине. Используется в системах, где СУБД SAS установлено на нескольких серверах для максимального использования суммарного процессорного времени.

    SAS/STAT
    Второй по востребованности продукт SAS после Base. Содержит набор процедур для статистического анализа данных. В SAS/STAT встроены алгоритмы разбиения данных на кластеры (группы), линейной регресии, оценки статистических гипотез и т.д. Помимо продукта STAT, содержащего основные стат. алгоритмы существуют продукты, разработанные на основе специализированных разделов математики.

    SAS/ETS (Econometrics Time Series)
    Содержит процедуры для анализа и прогнозирования временных рядов. Т.е. данных накапливаемых через равные промежутки времени. Например, это еженедельные объемы продаж, объемы перевозок и т.д.

    SAS/HPF (High Performance Forecasting)
    Расширяет возможности SAS/ETS по прогнозированию. При анализе большого кол-ва временных рядов использование SAS/ETS не эффективно из-за кол-ва времени,затрачиваемого на подбор модели для отдельного ряда. SAS/HPF cодержит алгоритмы подбора “оптимальной” модели и позволяет исключить участи

  • Желаете ознакомиться с остальными комментариями или оставить свой? в сеть, чтобы получить полный доступ к функционалу Профессионалов.ru! Еще не участник сети?