Historias
Slashboxes
Comentarios
 

Login Barrapunto

Login

[ Crear nueva cuenta ]

Programas para estadística

editada por rvr el Viernes, 29 Octubre de 2010, 22:00h   Printer-friendly   Email story
pobrecito hablador nos cuenta: «Estoy interesado en montar una 'start-up', pero para ello tendré que recoger multitud de datos a nivel socioeconómico (sectores, densidad de población, paro...). Una vez tenga todos los datos, la idea es crear un modelo matemático para predecir la situación económica. Hasta aquí todo muy claro, pero necesitaré procesar todos los datos. Hasta la fecha he visto R, Octave y Mathematica. ¿Recomendáis alguno? Por otro lado, si he de montar un 'cluster', ¿cuál creeis que será la mejor opción? ¿Quizá puedo aprovechar CUDA o stream? Como veis, voy pez. Gracias de antemano».

Mostrar opciones Umbral:
Y recuerda: Los comentarios que siguen pertenecen a las personas que los han enviado. No somos responsables de los mismos.
  • R y cluster

    (Puntos:2, Informativo)
    por pobrecito hablador el Viernes, 29 Octubre de 2010, 22:43h (#1247918)
    R sin duda. Se puede clusterizar facilmente. Pillate unos i7 y monta algo rapido de red. En mi laboratorio tenemos unos Xeon viejos y podemos hacer maravillas con simples programas en F77.
    [ Responder ]
    • Re:R y cluster de pobrecito hablador (Puntos:2) Viernes, 29 Octubre de 2010, 23:45h
      • Re:R y cluster de AlphaFreak (Puntos:2) Domingo, 31 Octubre de 2010, 14:33h
    • 4 respuestas por debajo de tu umbral de lectura actual.
  • Chiste fácil

    (Puntos:5, Divertido)
    por snookiex (35574) el Sábado, 30 Octubre de 2010, 18:25h (#1247923)
    ( http://kuwaiba.sourceforge.net/ | Última bitácora: Martes, 07 Diciembre de 2010, 04:56h )
    Simplemente contrata a Faragon.
    --
    ¡Inventario de red para las masas! Kuwaiba Open Network Inventory [sourceforge.net]
    [ Responder ]
  • alternativa

    (Puntos:1)
    por lopez (19865) el Sábado, 30 Octubre de 2010, 18:48h (#1247926)
    ( http://cerocoma.blogspot.com/ | Última bitácora: Lunes, 22 Febrero de 2010, 10:32h )
    Buenas,

    una alternativa antes de gastarte la pasta en equipo y montarlo por tu cuenta. Supongo que desarrollarás un modelo sobre un software X o crearas tu propio software, y cuando le vendas a alguien un estudio (o cuando estés realizando pruebas) será cuando necesites potencia de computación, y en función de la cantidad de datos y del tiempo en el que quieras realizar los cálculos necesitarás más o menos.

    En lugar de gastarte el dinero en un equipo que no sabes si vas a poder usar/rentabilizar, puedes hacer uso de algún servicio IaaS (Infraestructura como servicio) o PaaS (Plataforma como servicio). Yo en el que estoy más puesto es Azure de Microsoft, aunque tienes el EC2 de Amazon, AppEngine de Google y muchos más de otros no tan famosos. Lo bueno de estos es que pagas por lo que usas, montas el programa, dices que quieres usar 20 máquinas y cuando acabas los cálculos las desmontas. El viernes, por ejemplo, contaron en el PDC como Pixar usaba Azure para realizar el renderizado de este modo.

    Para que te hagas una idea una máquina de instancia pequeña en Azure son 0,0852 /h (un procesador de doble núcleo) y tienes modalidades mediana (el doble), grande (el cuadruple) y muy grande (por ocho :) y ahora van a sacar la muy pequeña que se entiende será la mitad y en un algoritmo que requiera poco calculo pero mucho trajín de datos puede ser una gran opción.

    Creo que es una alternativa a plantearse, un saludo
    --
    "Todo conocer depende de la estructura que conoce"
    [ Responder ]
  • Matematicas?

    (Puntos:1, Inspirado)
    por pobrecito hablador el Sábado, 30 Octubre de 2010, 19:10h (#1247929)
    Y luego se quejan algunos porque en economía se pasa la mitad del tiempo prediciendo y la otra explicando porque no sucedió, espero que este asesorado por alguien que haya estudiado economía como mínimo 5 años o terminara con números inútiles.
    [ Responder ]
    • Re:Matematicas? de pobrecito hablador (Puntos:1) Sábado, 30 Octubre de 2010, 20:33h
  • R

    (Puntos:3, Informativo)
    por El Pantera (19616) el Sábado, 30 Octubre de 2010, 19:59h (#1247936)
    ( http://barrapunto.com/ )
    Estoy de acuerdo, R es el mejor documentado [knuth.uca.es]
    --

    "Si alabaras al César no tendrías que comer alubias" ->"si tú comieras alubias no tendrías que alabar al César"
    [ Responder ]
  • Sugerencias

    (Puntos:1)
    por ComandanteMapache (48022) el Sábado, 30 Octubre de 2010, 21:27h (#1247950)
    tendré que recoger multitud de datos a nivel socioeconómico (sectores, densidad de población, paro...)

    El INE [www.ine.es] es tu punto de partida. Necesitarás BBDD, programas de extracción, un modelo de datos y pegarte con ellos. Vas a necesitar contratar personal. Aparte de ello, tendrás que actualizar tus datos según se publiquen los nuevos datos. Mucha tela que cortar.

    la idea es crear un modelo matemático para predecir la situación económica.

    Si realmente tienes ese modelo, te vas a hacer podridamente rico. No reinventes los macroeconómicos ni las fórmulas de la econometría, y por supuesto ten en cuenta que tu competencia, además de otras empresas, son los propios bancos y los organismos públicos. Puedes investigar a ver como lo hacen ellos. El resultado de tu modelo tiene que ser interpretado, necesitarás economistas que te ayuden.

    Aplaudo tu iniciativa emprendedora y de dar trabajo en los tiempos que corren y con los políticos que nos merecemos. Suerte!

    [ Responder ]
    • Re:Sugerencias de ComandanteMapache (Puntos:2) Domingo, 31 Octubre de 2010, 10:39h
    • 1 respuesta por debajo de tu umbral de lectura actual.
  • R

    (Puntos:1, Informativo)
    por pobrecito hablador el Sábado, 30 Octubre de 2010, 22:53h (#1247958)
    en mi laboratorio todos los estadísticos utilizan R + emacs + ESS [r-project.org]

    para paralelizarlo hay paquetes de R que proporcionan "bindings" a mpi como rmpi [r-project.org]. de todas formas escalar a muchas cpus con mpi es complicado si no tienes una red rápida y con bajas latencias como infiniband y un buen código. En benchmarks chorras que he hecho en mi cluster (gigabit ethernet) no he conseguido escalar a más de veinti pocas cpus.

    Si tu problema permite partionar el input es mucho mejor utilizar un sistema de colas o "batch queue system" para paralelizar la ejecución. Yo utilizo sge [sunsource.net]

    yo también opino como en el comentario que te hacen más arriba sobre el cloud. Si sólo vas a necesitar potencia de cálculo puntualmente el cloud es la mejor opción. Un cluster de cómputo vale mucha pasta.
    [ Responder ]
  • por nighto (5643) el Domingo, 31 Octubre de 2010, 08:04h (#1247990)
    Desde hace años unos de los mejores programas estadísticos -sino el mejor-, usado por la mayoría de universidades, es SPSS (Data Mining, Statistical Analysis Software, Predictive ...) Bye BYe
    --
    Close windows, Open source
    [ Responder ]
  • Pregunta a BP

    (Puntos:1, Inspirado)
    por pobrecito hablador el Domingo, 31 Octubre de 2010, 10:43h (#1248034)

    Hola, quiero construir un edificio de 50 pisos, mi primera duda es si pensais que es mejor utilizar para la cimentación pilotes de hormigón armado o una caja de flotación que además me serviría para hacer el garaje. Además no se si sostener la estructura basandome en un esqueleto externo de acero o si basar la sustentación en un núclero central de hormigón armado, que aunque pierdo algo de espacio sirve para hacer un espacio seguro para ascensores y escaleras. También quiero opiniones sobre el tipo de recubrimiento que recomendaríais para la fachada en ambos casos y si os parece viable para ese volumen la instalación de un sistema de calentamiento de aguas por energía solar directa sobre el tejado.

    [ Responder ]
  • por Abolicionista (35880) el Domingo, 31 Octubre de 2010, 23:14h (#1248143)
    ( http://technopolios.blogspot.com/ )
    Por lo visto necesitás algo más que un programa de estadísticas: necesitás un sistema de Inteligencia de Negocios [wikipedia.org] (Business Intelligence [sourceforge.net]) como es Pentaho [wikipedia.org] que desde hace un tiempo también viene integrado en OpenBravo [sourceforge.net]. Probalos y comentanos los resultados.
    [ Responder ]