{"id":2325,"date":"2022-10-28T19:00:33","date_gmt":"2022-10-28T22:00:33","guid":{"rendered":"https:\/\/pixforce.ai\/?p=2325"},"modified":"2023-09-04T11:53:11","modified_gmt":"2023-09-04T14:53:11","slug":"machine-learning-entenda-o-que-sao-datasets","status":"publish","type":"post","link":"https:\/\/pixforce.com\/pt-br\/machine-learning-entenda-o-que-sao-datasets\/","title":{"rendered":"Datasets e machine learning: conhe\u00e7a suas caracter\u00edsticas"},"content":{"rendered":"<p><em>Conjuntos de dados s\u00e3o utilizados para que sistemas possam aprender e identificar um determinado tipo de padr\u00e3o. Para que essa aprendizagem aconte\u00e7a, o sistema precisa ser alimentado com as informa\u00e7\u00f5es adequadas, que s\u00e3o selecionadas visando um resultado espec\u00edfico. A partir disso, \u00e9 poss\u00edvel resolver uma grande quantidade de problemas sem interven\u00e7\u00e3o humana.<\/em><\/p>\n<p><img fetchpriority=\"high\" decoding=\"async\" class=\"aligncenter size-medium wp-image-3206\" src=\"https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-01-640x474.png\" alt=\"Datasets e machine learning: conhe\u00e7a suas caracter\u00edsticas\" width=\"640\" height=\"474\" srcset=\"https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-01-640x474.png 640w, https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-01-960x711.png 960w, https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-01-160x120.png 160w, https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-01-768x569.png 768w, https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-01-1536x1137.png 1536w, https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-01.png 1715w\" sizes=\"(max-width: 640px) 100vw, 640px\" \/><\/p>\n<p>O conceito de <a href=\"https:\/\/pixforce.com\/o-que-e-machine-learning-conheca-essa-tecnologia-revolucionaria\/\" target=\"_blank\" rel=\"noopener\">Machine Learning (ML)<\/a> se d\u00e1 atrav\u00e9s do <strong>desenvolvimento de algoritmos capazes de aprender e detectar padr\u00f5es.<\/strong> Para que esses algoritmos funcionem, eles precisam ser alimentados por uma s\u00e9rie de dados que, se programados da maneira correta, conseguem fazer com que o mecanismo funcione com pouca ou nenhuma intera\u00e7\u00e3o humana. <strong>Os conjuntos destes dados recebem o nome de Datasets.<\/strong><\/p>\n<p>De acordo com Luis Felipe Zeni, Deep Learning Engineer da Pix Force, respons\u00e1vel por compet\u00eancias fortes de engenharia de software, <strong>Datasets se definem como uma cole\u00e7\u00e3o de dados anotados com supervis\u00e3o necess\u00e1ria para treinar algum tipo de modelo baseado em Machine Learning (ML).<\/strong> Dentro da Pix Force, estes modelos s\u00e3o fundamentados no conceito de Redes Neurais.<\/p>\n<p>Recentemente falamos sobre Redes Neurais, mecanismos que, atrav\u00e9s de ML, distribuem informa\u00e7\u00f5es de modo semelhante ao c\u00e9rebro humano. Dentro do Machine Learning, \u00e9 poss\u00edvel que os elementos de processamento se re\u00fanam para interpretar informa\u00e7\u00f5es de forma paralela, trabalhando atrav\u00e9s de camadas. <strong>Os Datasets ent\u00e3o s\u00e3o o material que alimenta estas camadas.<\/strong><\/p>\n<p>Quer entender o que s\u00e3o e como funcionam as Redes Neurais? Veja <a href=\"http:\/\/link.com\/\" target=\"_blank\" rel=\"noopener\">aqui<\/a>.<\/p>\n<h3>Conhe\u00e7a o processo de treinamento baseado em datasets<\/h3>\n<p>Para compreender como Redes Neurais utilizam Datasets para seres treinadas, precisamos entender o conceito de anota\u00e7\u00f5es. Anota\u00e7\u00f5es s\u00e3o os crit\u00e9rios diferenciais que definem o resultado esperado atrav\u00e9s de um processo de Redes Neurais.<\/p>\n<p><strong>Elas funcionam como modelos do tipo de respostas que se deseja ao final do desempenho, e podem se dividir entre classes, pontos, bounding boxes, pol\u00edgonos, imagens e muito mais.<\/strong><\/p>\n<figure id=\"attachment_3208\" aria-describedby=\"caption-attachment-3208\" style=\"width: 174px\" class=\"wp-caption alignleft\"><img decoding=\"async\" class=\"wp-image-3208 \" src=\"https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-02-414x480.jpg\" alt=\"Datasets e machine learning: conhe\u00e7a suas caracter\u00edsticas\" width=\"174\" height=\"201\" srcset=\"https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-02-414x480.jpg 414w, https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-02-621x720.jpg 621w, https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-02-768x890.jpg 768w, https:\/\/pixforce.com\/wp-content\/uploads\/2022\/10\/Datasets-e-machine-learning-conheca-suas-caracteristicas-02.jpg 820w\" sizes=\"(max-width: 174px) 100vw, 174px\" \/><figcaption id=\"caption-attachment-3208\" class=\"wp-caption-text\">Exemplo de imagem com anota\u00e7\u00e3o<\/figcaption><\/figure>\n<p><strong>Anota\u00e7\u00f5es de classes servem para classificar um aspecto espec\u00edfico de uma imagem.<\/strong> Por exemplo, se o objetivo do processo \u00e9 diferenciar o que s\u00e3o imagens de cachorros do que s\u00e3o imagens de gatos, as anota\u00e7\u00f5es utilizadas devem ser imagens de cachorros e gatos.<\/p>\n<p>Quanto mais ricas forem as anota\u00e7\u00f5es, mais material a rede ter\u00e1 para entender a diferen\u00e7a entre os dois aspectos, e melhores ser\u00e3o as respostas finais.<\/p>\n<p>Ainda em rela\u00e7\u00e3o \u00e0s anota\u00e7\u00f5es, Zeni destaca que alguns crit\u00e9rios devem ser levados em conta. A qualidade das imagens torna-se muito importante, j\u00e1 que detalhes do cachorro e do gato, utilizando o exemplo dado acima, precisam ficar evidentes.<\/p>\n<p><strong>\u00c9 importante tamb\u00e9m que haja o m\u00ednimo de 500 amostras para cada classe, e que elas sejam igualmente distribu\u00eddas entre os tipos de respostas que se espera.<\/strong> Ilumina\u00e7\u00e3o e espa\u00e7o f\u00edsico tamb\u00e9m devem ser levados em considera\u00e7\u00e3o, e \u00e9 muito importante que os respons\u00e1veis por colher as anota\u00e7\u00f5es sejam bem orientados.<\/p>\n<h3>Backpropagation, o neur\u00f4nio mais importante de uma rede<\/h3>\n<p>Backpropagation \u00e9 o m\u00e9todo de reajuste dos pesos das Redes Neurais, ou seja, quando se chega a um resultado ap\u00f3s um treinamento. A partir da\u00ed \u00e9 calculada uma taxa de erro chamada Loss, que \u00e9 onde os pesos entre os neur\u00f4nios s\u00e3o reajustados.<\/p>\n<p>A principal fun\u00e7\u00e3o do Backpropagation \u00e9 corrigir os pesos de todas as camadas, partindo da sa\u00edda at\u00e9 a entrada. <strong>Isso acontece atrav\u00e9s de um erro calculado, e o Backpropagation funciona angulando as entradas e sa\u00eddas das redes neurais, dentro de um processo de Deep Learning. Para isso, s\u00e3o necess\u00e1rias duas fases: a forward pass (passo para frente) e a backward pass (passo para tr\u00e1s).<\/strong><\/p>\n<p>Na fase forward pass (treinamento), obt\u00e9m-se a previs\u00e3o da sa\u00edda, ou seja, \u00e9 quando se prev\u00ea atrav\u00e9s das anota\u00e7\u00f5es inseridas qual resultado final vai ser entregue pela rede. Esta fase tamb\u00e9m \u00e9 conhecida como fase de propaga\u00e7\u00e3o.<\/p>\n<p>J\u00e1 a backward pass identifica o gradiente da fun\u00e7\u00e3o de perda na camada final, o que garante a regra de cadeia, que atualiza os pesos de todas as camadas da rede como se fosse um calibre.<\/p>\n<h3>Entenda a aplica\u00e7\u00e3o na pr\u00e1tica: datasets e machine learning<\/h3>\n<p><strong>As Redes Neurais s\u00e3o utilizadas principalmente para criar sistemas de Intelig\u00eancia Artificial (IA).<\/strong> Quando falamos sobre as anota\u00e7\u00f5es necess\u00e1rias para criar este sistema de Machine Learning (ML), falamos tamb\u00e9m sobre <a href=\"https:\/\/pixforce.com\/visao-computacional-um-guia-completo-para-tirar-suas-duvidas\/\" target=\"_blank\" rel=\"noopener\">Vis\u00e3o Computacional<\/a>, j\u00e1 que os padr\u00f5es s\u00e3o definidos atrav\u00e9s de imagens.<\/p>\n<p>A utilidade de uma Rede Neural \u00e9 semelhante a de todas as m\u00e1quinas criadas pelo homem: poupar tempo e potencializar um determinado resultado final.<\/p>\n<p>Ainda n\u00e3o aprendeu sobre Intelig\u00eancia Artificial e Vis\u00e3o Computacional? Aprenda <a href=\"http:\/\/link.com\/\" target=\"_blank\" rel=\"noopener\">aqui<\/a>.<\/p>\n<p>Entre os exemplos pr\u00e1ticos de aplica\u00e7\u00e3o de Redes Neurais, podemos citar a previs\u00e3o do tempo, em que informa\u00e7\u00f5es sobre a velocidade do tempo, forma\u00e7\u00e3o de nuvens e hist\u00f3rico de chuvas s\u00e3o inseridas, e \u00e9 calculada uma resposta que prev\u00ea o clima dos dias seguintes.<\/p>\n<p>Da mesma forma acontece o exemplo dentro da Vis\u00e3o Computacional: <strong>a rede compreende as informa\u00e7\u00f5es de imagens e pode classific\u00e1-las ou separ\u00e1-las a partir da informa\u00e7\u00e3o que elas cont\u00eam.<\/strong> Estes sistemas s\u00e3o capazes de resolver uma grande quantidade de problemas, incluindo a identifica\u00e7\u00e3o de Equipamentos de Prote\u00e7\u00e3o Individual (EPIs) e a temperatura corporal de trabalhadores.<\/p>\n<p>Criado pela startup Pix Force, o <strong>Pix Thermo funciona fazendo a identifica\u00e7\u00e3o autom\u00e1tica de especificidades relacionadas \u00e0 seguran\u00e7a.<\/strong> A solu\u00e7\u00e3o, que \u00e9 considerada 100% eficaz, sana uma dor identificada durante a pandemia de covid 19: proteger ao m\u00e1ximo os funcion\u00e1rios e colaboradores da empresa.<\/p>\n<p>A fun\u00e7\u00e3o do dispositivo \u00e9, atrav\u00e9s de sensores espec\u00edficos, realizar a medi\u00e7\u00e3o de temperatura corporal de forma r\u00e1pida e confi\u00e1vel. Da mesma forma, ele tamb\u00e9m utiliza o reconhecimento de padr\u00f5es para fazer identifica\u00e7\u00e3o facial e leitura de documentos.<\/p>\n<p>Assim, o funcion\u00e1rio \u00e9 corretamente identificado, tem uso de (EPIs) avaliado e sua temperatura conferida. A ideia \u00e9 que o Pix Thermo consiga validar v\u00e1rias quest\u00f5es de forma r\u00e1pida e eficaz, aplicando a tecnologia na resolu\u00e7\u00e3o de dores latentes do mercado.<\/p>\n<p>Quer continuar aprendendo? Veja <a href=\"http:\/\/link.com\/\" target=\"_blank\" rel=\"noopener\">aqui<\/a> como \u00e9 criado um sistema de Vis\u00e3o Computacional.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Conjuntos de dados s\u00e3o utilizados para que sistemas possam aprender e identificar um determinado tipo de padr\u00e3o. Para que essa aprendizagem aconte\u00e7a, o sistema precisa ser alimentado com as informa\u00e7\u00f5es adequadas, que s\u00e3o selecionadas visando um resultado espec\u00edfico. A partir disso, \u00e9 poss\u00edvel resolver uma grande quantidade de problemas sem interven\u00e7\u00e3o humana. O conceito de [&hellip;]<\/p>\n","protected":false},"author":29,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","_external_link":"","footnotes":""},"categories":[1],"tags":[],"class_list":["post-2325","post","type-post","status-publish","format-standard","hentry","category-noticias"],"_links":{"self":[{"href":"https:\/\/pixforce.com\/pt-br\/wp-json\/wp\/v2\/posts\/2325","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/pixforce.com\/pt-br\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/pixforce.com\/pt-br\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/pixforce.com\/pt-br\/wp-json\/wp\/v2\/users\/29"}],"replies":[{"embeddable":true,"href":"https:\/\/pixforce.com\/pt-br\/wp-json\/wp\/v2\/comments?post=2325"}],"version-history":[{"count":0,"href":"https:\/\/pixforce.com\/pt-br\/wp-json\/wp\/v2\/posts\/2325\/revisions"}],"wp:attachment":[{"href":"https:\/\/pixforce.com\/pt-br\/wp-json\/wp\/v2\/media?parent=2325"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/pixforce.com\/pt-br\/wp-json\/wp\/v2\/categories?post=2325"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/pixforce.com\/pt-br\/wp-json\/wp\/v2\/tags?post=2325"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}