Login Barrapunto
Programas para estadística
pobrecito hablador nos cuenta: «Estoy interesado en montar una 'start-up', pero para ello tendré que recoger multitud de datos a nivel socioeconómico (sectores, densidad de población, paro...). Una vez tenga todos los datos, la idea es crear un modelo matemático para predecir la situación económica. Hasta aquí todo muy claro, pero necesitaré procesar todos los datos. Hasta la fecha he visto R, Octave y Mathematica. ¿Recomendáis alguno? Por otro lado, si he de montar un 'cluster', ¿cuál creeis que será la mejor opción? ¿Quizá puedo aprovechar CUDA o stream? Como veis, voy pez. Gracias de antemano».
« Red Asturcon, o la inversión de los fondos mineros | Festival de música copyleft en Malasaña (Madrid) »
Y recuerda: Los comentarios que siguen pertenecen a las personas que los han enviado. No somos responsables de los mismos.

R y cluster
(Puntos:2, Informativo)Chiste fácil
(Puntos:5, Divertido)( http://kuwaiba.sourceforge.net/ | Última bitácora: Martes, 07 Diciembre de 2010, 04:56h )
¡Inventario de red para las masas! Kuwaiba Open Network Inventory [sourceforge.net]
alternativa
(Puntos:1)( http://cerocoma.blogspot.com/ | Última bitácora: Lunes, 22 Febrero de 2010, 10:32h )
una alternativa antes de gastarte la pasta en equipo y montarlo por tu cuenta. Supongo que desarrollarás un modelo sobre un software X o crearas tu propio software, y cuando le vendas a alguien un estudio (o cuando estés realizando pruebas) será cuando necesites potencia de computación, y en función de la cantidad de datos y del tiempo en el que quieras realizar los cálculos necesitarás más o menos.
En lugar de gastarte el dinero en un equipo que no sabes si vas a poder usar/rentabilizar, puedes hacer uso de algún servicio IaaS (Infraestructura como servicio) o PaaS (Plataforma como servicio). Yo en el que estoy más puesto es Azure de Microsoft, aunque tienes el EC2 de Amazon, AppEngine de Google y muchos más de otros no tan famosos. Lo bueno de estos es que pagas por lo que usas, montas el programa, dices que quieres usar 20 máquinas y cuando acabas los cálculos las desmontas. El viernes, por ejemplo, contaron en el PDC como Pixar usaba Azure para realizar el renderizado de este modo.
Para que te hagas una idea una máquina de instancia pequeña en Azure son 0,0852
Creo que es una alternativa a plantearse, un saludo
"Todo conocer depende de la estructura que conoce"
Matematicas?
(Puntos:1, Inspirado)R
(Puntos:3, Informativo)( http://barrapunto.com/ )
"Si alabaras al César no tendrías que comer alubias" ->"si tú comieras alubias no tendrías que alabar al César"
Sugerencias
(Puntos:1)El INE [www.ine.es] es tu punto de partida. Necesitarás BBDD, programas de extracción, un modelo de datos y pegarte con ellos. Vas a necesitar contratar personal. Aparte de ello, tendrás que actualizar tus datos según se publiquen los nuevos datos. Mucha tela que cortar.
la idea es crear un modelo matemático para predecir la situación económica.
Si realmente tienes ese modelo, te vas a hacer podridamente rico. No reinventes los macroeconómicos ni las fórmulas de la econometría, y por supuesto ten en cuenta que tu competencia, además de otras empresas, son los propios bancos y los organismos públicos. Puedes investigar a ver como lo hacen ellos. El resultado de tu modelo tiene que ser interpretado, necesitarás economistas que te ayuden.
Aplaudo tu iniciativa emprendedora y de dar trabajo en los tiempos que corren y con los políticos que nos merecemos. Suerte!
R
(Puntos:1, Informativo)para paralelizarlo hay paquetes de R que proporcionan "bindings" a mpi como rmpi [r-project.org]. de todas formas escalar a muchas cpus con mpi es complicado si no tienes una red rápida y con bajas latencias como infiniband y un buen código. En benchmarks chorras que he hecho en mi cluster (gigabit ethernet) no he conseguido escalar a más de veinti pocas cpus.
Si tu problema permite partionar el input es mucho mejor utilizar un sistema de colas o "batch queue system" para paralelizar la ejecución. Yo utilizo sge [sunsource.net]
yo también opino como en el comentario que te hacen más arriba sobre el cloud. Si sólo vas a necesitar potencia de cálculo puntualmente el cloud es la mejor opción. Un cluster de cómputo vale mucha pasta.
SPSS - Simply the Best
(Puntos:1)Close windows, Open source
Pregunta a BP
(Puntos:1, Inspirado)Hola, quiero construir un edificio de 50 pisos, mi primera duda es si pensais que es mejor utilizar para la cimentación pilotes de hormigón armado o una caja de flotación que además me serviría para hacer el garaje. Además no se si sostener la estructura basandome en un esqueleto externo de acero o si basar la sustentación en un núclero central de hormigón armado, que aunque pierdo algo de espacio sirve para hacer un espacio seguro para ascensores y escaleras. También quiero opiniones sobre el tipo de recubrimiento que recomendaríais para la fachada en ambos casos y si os parece viable para ese volumen la instalación de un sistema de calentamiento de aguas por energía solar directa sobre el tejado.
Business Intelligence
(Puntos:1)( http://technopolios.blogspot.com/ )