Comunicado sobre a nossa cobertura de hoje: falhamos, e foi muito feio

Pasta do MacMagazine (logo)

Prezados leitores,

Como humanos, nós do MacMagazine estamos acostumados a errar. Erramos em certas decisões, em informações, em traduções, em respostas… mas, como amantes da Apple que somos, tentamos ser o mais perfeccionistas possível e buscamos evitar isso tudo ao máximo, buscando corrigir esses erros o quanto antes, sempre que possível. Às vezes uma palavra digitada errado que tenha ficado no ar por cinco minutos já nos angustia. Não nos conformamos com nossos erros e definitivamente buscamos tomar as devidas providências para que eles nunca mais se repitam.

Pasta do MacMagazine (logo)

A falha de hoje foi terrível, nos deixou sem chão… literalmente desesperados. Nossa equipe estava pronta para a cobertura — eu (Rafael) no texto do live blogging, o Marcelo me ajudando com imagens, o Eduardo e o Hugo nos posts do blog, e a Larissa no Twitter. Mas, com exceção da Lari, todos nós ficamos impossibilitados de fazer o nosso trabalho e de dar o nosso melhor para trazer informações atualizadas para você, em claro e bom português.

Esta não foi a primeira vez que enfrentamos um problema com o servidor do site. Instabilidades aqui e ali acontecem, estamos constantemente trabalhando para melhorar isso. Dificuldades maiores em eventos da Apple também já aconteceram, mas nunca na magnitude de hoje. Assim que colocamos o nosso post da cobertura ao vivo no ar, menos de meia hora antes de o evento começar, o nosso servidor disparou em uso. Conseguimos iniciar a coisa, mas quando a keynote começou pra valer, não durou mais alguns minutos e aí caímos de vez. Até conseguimos contornar a coisa e voltar ao ar algumas vezes, mas aí outros problemas surgiram (ficamos impossibilitados de postar nada) que naturalmente demoraram a ser solucionados. A coisa é bastante complexa.

Não fomos negligentes quanto aos preparativos para o evento. Alguns de vocês devem ter acompanhado que, na semana passada, passamos por uma migração de servidores. Essa mudança foi fundamental para termos uma maior flexibilidade no ajuste dos recursos disponíveis na nossa máquina, e com ela feita pudemos, na madrugada de sábado para domingo, aumentar ainda mais as capacidades do servidor em preparação para esta cobertura. Acreditem: nosso site está rodando hoje numa infraestrutura bastante parruda — e não é um investimento pequeno.

Em paralelo a isso, nós resolvemos arriscar. Por muito tempo usamos um sistema terceirizado para nossas coberturas, chamado CoveritLive. Este, porém, já nos deixou na mão algumas vezes — mesmo quando o nosso servidor estava aguentando firme. Por isso, resolvemos agora centralizar tudo localmente e, se tivéssemos um problema, que fosse realmente culpa nossa. E foi o que aconteceu, terminando por culminar no pior.

Se poderíamos ter investido ainda mais num servidor mais potente? Sim, mas não acho que o erro maior foi esse. Grandes veículos e a própria Apple já enfrentaram problemas de sobrecarga em dias como este, muita gente até brinca que essas keynotes costumam “derrubar a internet”. É muito complicado mensurar qual será o tráfego real e a resposta que isso terá no nosso servidor, a fim de afirmar com certeza que uma infraestrutura qualquer irá dar conta do recado sem problemas. Também temos que levar em consideração que, a cada novo evento da Apple, nossa audiência está maior do que antes. O site continua crescendo muito rápido, e nós precisamos nos adaptar a isso.

Talvez o erro maior foi o tal novo sistema de cobertura local, que certamente pôs um peso absurdamente grande no servidor. Mas foi um erro que precisávamos cometer. Embora a coisa tenha sido previamente testada e preparada, não tínhamos condições de simular um tráfego como o que tivemos durante o evento e aí saber se a estrutura daria conta ou não. Foi uma aposta ousada, um risco que nos dispomos a correr para tentar prover uma melhor experiência para os leitores e não depender de nada externo. No final das contas, foi exatamente algo externo que nos “salvou” um pouco — a cobertura resumida que a Lari fez no nosso Twitter. Mas o Twitter é apenas para alguns destaques, primeiro porque não queremos inundar as timelines alheias, depois porque o próprio Twitter impõe um limite horário de postagens — e nós também já enfrentamos esse sério problema, quando decidimos fazer uma cobertura ao vivo completa por lá.

Nos dias que antecederam este evento, fiquei muito tenso me preparando para dar conta de toda a avalanche de novidades que a Apple costuma trazer — e hoje não foi diferente. Se não tivéssemos enfrentado absolutamente nenhum problema no servidor, já é difícil fazer uma cobertura completa, rápida e impecável como as que sempre nos propomos a fazer mas, meus amigos, não há nada pior e mais estressante do que você simplesmente ficar impossibilitado de realizar o seu trabalho devido a um problema técnico.

Desde o começo do evento contamos com o forte apoio dos especialistas técnicos do nosso provedor de hospedagem — a Liquid Web, onde estamos há anos —, porém uma vez que o tráfego e consumo de recursos do servidor estão nas alturas não há muito o que se fazer. Eles não tiveram responsabilidade pelo ocorrido.

O que nós faremos daqui em diante, ainda não sei responder exatamente. Temos algumas coisas em mente, mas certamente não será simplesmente abandonar a solução nativa de cobertura e voltar a usar um CoveritLive ou outro serviço semelhante da vida. Isso já foi um problema no passado para nós — não na mesma escala de hoje, mas foi —, então voltar a uma situação simplesmente “mais ou menos” não está sob cogitação. Nós queremos resolver isso de uma vez por todas e nunca mais termos que escrever um post de esclarecimento como este. Queremos poder realizar o nosso trabalho, sem dores de cabeça inconcebíveis como esta.

Mesmo com um atraso inaceitável, a partir de agora trabalharemos para trazer todas as informações do dia para vocês, nos mínimos detalhes, até que coloquemos a casa em ordem. É bastante coisa, então pedimos paciência porque iremos trazer uma bateria de artigos para vocês — provavelmente até a madrugada.

Pedimos mais uma vez profundas e sinceras desculpas pela nossa falha de hoje. Espero que nos deem uma chance de nos redimirmos, no próximo grande evento da Apple.

Posts relacionados

Comentários